musicRAG,a rag for music 一、核心观点 音乐类 AI 应用,本质上是内容消费,不只是大模型的应用 内容消费是一种“策展”,组合和顺序也是内容 音乐是耐用品,但在单次消费场景里,表现出很强的快销品属性,受到潮流节目或意外事件的传播,音乐被赋予新意义,变成新内容 “生成”可以理解成“搜索的召回”,音乐类 AI 应用召回 playlist,作为个性化推荐,也可用于真正的“音乐生成” 二、将 GraphRAG 应用于音乐类服务 2.1. 大模型增强了对音乐的理解 对音乐相关的非结构化内容的理解 对使用场景下,用户隐藏的意图识别 2.2. 歌曲之间/音乐之间的关联是复杂的 关联受到文化因素的影响 受到流行文化的影响 受到场景(也就是输入)的影响 2.3. 不同的音乐应用形态 场景下的输入 + MusicRAG 输出 -> 内容可以包装成 Query Playlist + 文案 音乐剧,演奏会 运动:心跳 + 配速节奏 Playlist 适合跑步的播放列表 睡眠:心跳 + 睡眠习惯 Playlist 适合睡前的播放列表 情感识别 Playlist + 文案 抚慰心灵的音乐 三、如何实现 MusicRAG 3.1. 收集分解音乐 恒定的内容:指较少受到时间和潮流影响的内容 更新的内容:指易受潮流影响,可以叠加在音乐上的新内容,如一首歌曲被某电影应用为插曲,赋予了新意义 3.2. 理解音乐 结构化内容 非结构化内容:音色、配器、文化意义、情感倾向、…… 3.3. 生成应用音乐 类似专辑:输出 Playlist + 专辑文案 类似演唱会:输出 Playlist + 歌曲之间的专场文案 配合其他知识库生成内容 为用户直接生成音乐 四、谁来实现 MusicRAG 服务 音乐版权方 音乐生成模型