你肯定经历过——脑子里有个超棒的想法,打了半天字,AI给你一段完全不搭边的东西。再试,还是不行。试了十几次,算了,关掉。不是你不行,是你说的“人话”太模糊了。“一首好听的歌”,AI懂什么算“好听”?它只能猜。下面50个提示词,把你的“模糊感觉”翻译成“AI听得懂的精准指令”。满意率直接从碰运气拉到九成以上。
你做AI音乐还在靠盲猜?这50个提示词让成品满意率飙升90%

一、风格维度——先定大方向别说“流行”“电子”这种一级分类。往下沉一层,AI的发挥空间就被收窄了,出来的东西反而更准。
1. 不说pop,说bedroom pop(卧室流行)——自带低保真、亲密感
2. 不说electronic,说downtempo electronica(缓拍电子)——自带松弛、夜晚感
3. 不说rock,说post-rock(后摇滚)——自带情绪铺陈、从安静到爆发
4. 不说jazz,说lo-fi jazz hip-hop(低保真爵士嘻哈)——自带学习/放松场景
5. 不说classical,说modern classical(现代古典)——自带极简、氛围感
二、情绪维度——用具体代替模糊“悲伤”“快乐”这种词,AI和你的理解可能差一个银河系。用更精准的情绪词,AI执行起来偏差小很多。
6. 不说sad,说melancholic(忧郁)或wistful(怅惘)
7. 不说happy,说euphoric(欣快)或carefree(无忧无虑)
8. 不说angry,说tense(紧张)或brooding(压抑的愤怒)
9. 不说calm,说serene(宁静)或contemplative(沉思的)
10. 不说romantic,说intimate and tender(亲密而温柔)
三、音色质感维度——去塑料感的关键AI做出来的声音为什么经常“假”?因为你没告诉它声音的“材质”。加上这些词,质感立刻不一样。

  1. warm(温暖的)——高频收一点,听着不冷
  2. grainy(颗粒感的)——像老照片,有种粗粝的美
  3. lush(丰满的)——声音层次多,不单薄
  4. crystalline(水晶般的)——干净的、透明的亮
  5. muffled(被蒙住的)——像隔着墙听,有距离感
    四、空间感维度——从“扁平”到“立体”没写空间感的提示词,AI默认所有声音在同一个平面上对着你轰。写了,就有前后纵深的声场。
  6. cathedral reverb(教堂混响)——庄严肃穆,声音传很远
  7. intimate room(亲密房间)——在你耳边唱的贴近感
  8. wide stereo field(宽广声场)——声音在两耳之间拉开
  9. in the distance(在远处)——某个乐器退到后面
  10. close-mic'd(近距离拾音)——某个乐器贴在你脸前
    五、节奏律动维度——让音乐“动起来”别只说“快点”“慢点”。告诉AI节奏的性格,它才知道该怎么动。
  11. swung(摇摆的)——不是机器人打拍子,有人味
  12. syncopated(切分的)——重音在你意想不到的地方
  13. half-time feel(半速感)——同样速度,感觉慢一半
  14. driving(推进的)——节奏催着你往前
  15. laid-back behind the beat(拖拍的松弛)——故意懒洋洋靠在拍子后面
    六、结构动态维度——从“片段”到“作品”AI最擅长生成30秒好听的片段然后无限循环。给它一个时间线,它才能做出一首有头有尾的作品。
  16. starts minimal, builds gradually(从极简开始,逐步建构)
  17. quiet verse, explosive chorus(安静主歌,爆发副歌)
  18. sudden breakdown, then full return(突然抽空,再饱满回归)
  19. slow-burn buildup to a massive climax(慢燃推进到巨大高潮)
  20. fades out slowly, like disappearing into fog(缓慢淡出,如消失在雾中)
    七、配器主角维度——告诉AI该让谁站C位什么都想突出等于什么都没突出。每次只推一两个乐器到前面,剩下的退后。
  21. piano-led(钢琴主导)
  22. string-driven(弦乐驱动)
  23. guitar-forward(吉他前置)
  24. voice-centered(人声为主)
  25. synth-heavy(合成器为主线)
    八、歌词意象维度——告别“梦想远方”AI写歌词最容易批发“梦想”“远方”“星光”“泪水”。给它具体的物件和场景,出来的歌词才有灵魂。
    36. 不说“我想你”,写“你的牙刷还放在原来的杯子里”
    37. 不说“我很孤独”,写“外卖备注多放一双筷子”
    38. 不说“时间过得好快”,写“那张电影票上的字已经看不清了”
    39. 不说“我很遗憾”,写“如果那天我回头了”
    40. 不说“梦想很大”,写“把辞职信塞进抽屉最下面那张纸”
    九、人声质感维度——让AI唱歌有人味AI人声最容易像导航语音。加上这些描述,让它听起来像真人。
  26. breathy vocal(带气声的)——亲密、脆弱感
  27. raspy and tired(沙哑疲惫的)——有故事的声音
  28. whispered delivery(耳语般的)——在你耳边轻轻唱
  29. belting with emotion(充满力量的情感爆发)——副歌该有的力度
  30. soft falsetto(轻柔假声)——飘在空气中的美感
    十、复合模板维度——一句囊括多个维度熟练了单个维度的词之后,直接把几个维度拼成一句。下面五个模板是现成的,改个主题就能用。
    46. 治愈钢琴曲模板:A warm, intimate piano piece in a small room. Soft pedal, gentle mechanical noises. Melancholic but hopeful. Like afternoon sunlight through dusty windows.
    47. 史诗预告片模板:Hybrid orchestral, starts with low string pulse. Brass enters gradually, massive percussion at key moments. From whisper to roar, ends abruptly with sub-bass rumble.
    48. 氛围电子模板:Downtempo electronica, grainy analog synths, airy vocal chops. Spacious reverb, like floating in a dark ocean. Breathes slowly, no rush.
    49. 民谣叙事模板:Guitar-forward folk, intimate male vocal. A story about a small town and a missed opportunity. Loose, unsyncopated rhythm. Warm and honest, nothing shiny.
    50. 中国风写意模板:Chinese orchestral, dizi flute carries the melody. Guzheng with light harmonics like water ripples. Erhu enters in the distance. Pentatonic base with occasional color notes. Leave space in between, like ink painting.
    这50个词,不用背,存下来当词典用。下次做歌之前,从每个维度挑一两个词塞进提示词里,再点生成。