核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
亚克力鱼缸这么容易模糊吗?
亚克力鱼缸这么容易模糊吗?...(144 )人阅读时间:2025-06-19 00:55:11
前几周Deepseek都是神一般的存在,为啥热度消散得这么快?
前几周Deepseek都是神一般的存在,为啥热度消散得这么快?...(144 )人阅读时间:2025-06-19 00:00:13
如何评价MiniMax开源首个视觉RL统一框架V-Triune,实现推理感知一肩挑,其技术上有何优势?
如何评价MiniMax开源首个视觉RL统一框架V-Triune,实现推理感知一肩挑,其技术上有何优势?...(144 )人阅读时间:2025-06-19 00:35:12
吉他弹了三年了,拿到谱子都能弹,基本的弹奏技巧都会,可没谱***不了,不会抓歌。每天该怎么练呢?
吉他弹了三年了,拿到谱子都能弹,基本的弹奏技巧都会,可没谱***不了,不会抓歌。每天该怎么练呢?...(144 )人阅读时间:2025-06-19 00:45:11