大语言模型带来的一些启发

2023/6/5 21:32:59

仅代表个人看法,不喜勿喷。

The limits of my language means the limits of my world. (Ludwig Wittgenstein)

我的语言的极限意味着我的世界的极限。——维特根斯坦

大语言模型解决的不仅是处理文本相关问题,它带来的是人对世界的理解,或者说让机器可以直接理解人的意图,而不再需要翻译成指邻、代码,而语言本身又隐含了人对世界的理解。从这个角度看,自然语言模型引领AI时代的进步也就不足为奇了。

十年前说这个,可能觉得很科幻吧;三年前,当看到GPT-3生成的驴唇不对马嘴的文章和回答,也只当是个炒作的噱头,一笑了之;最近两个月发布的AI进展真称得上是日新月异了,在这一刻,当ChatGPT仅两个月就月活过亿,那只能说,你可以不变,但阻止不了世界改变。

过分拟合人的想法是对真实世界的扭曲

图片来自 GPT-4 论文[1],对比了预训练模型和使用强化学习调优后模型预测的分布。可以看到,没调前(左图)和真实分布基本是一致的:世界是什么样,模型就学成了什么样;学习调优反而不一致了。强化学习的目标是让AI的回答更符合人的提问意图,以及去除毒性(数据中的偏见、攻击性)。
数据也是人生成的,也有鸡汤,也有漫骂,所以…… 当有一天,我们看到世界的全貌,会怎么样?

image.png

你想要的答案到底是什么

探讨来自谷歌2022年初探讨聊天机器人的论文LaMDA[2],论文从三方面评估聊天机器人的回答质量:

  • sensibleness:文本是否合理,跟历史对话是否有冲突(靠谱)
    瞎编乱造,前后矛盾肯定是不行的,回答最好还能有理有据。
  • Specificity:对于提问是否有针对性,避免笼统回复(有用)
    比如你问AI,这电影怎么样?它回答“不错”,这就等于没说,你需要告诉好在哪。
  • Interestingness:文本是否能引起人的注意或者好奇,是否是超出期待的巧妙回复(有趣)
    最好还能带来启发,满足情绪上的一些需求。
    (三者权重不同)
    从某个角度上讲,这也是我们对人的期许,逐层渐进。是不是觉得有点像:找男朋友的筛选标准?

多闻和推理需要不同的训练途径

实验来自DeepMind(发明AlphaGo的公司)在2021年12月发布的一篇论文:Gopher[3]
任何学术科目,连同一般知识,通过改进模型规模都能提升其效果,但规模对逻辑推理、常识和数学任务的好处较少。
最近一两年,出现的一些针对逻辑推理的训练方法,比如 CoT:Chain-of-Thought思想链,主要指模型的多步推理能力,以解决更为复杂的问题。

Google的PaLM论文[4]里,有很多推理示例,比如下面这个推理示例:

用户输入:迈克尔在法国那个非常有名的博物馆里看它最著名的画作。然而,创作这幅画的艺术家恰恰让迈克尔想起了他小时候最喜欢的卡通人物。卡通人物平时手里拿的东西是哪个国家的?

模型输出:卢浮宫最著名的画作是蒙娜丽莎。制作蒙娜丽莎的艺术家是达芬奇。 Leonardo da Vinci 也是卡通忍者神龟中主角的名字。列奥纳多·达·芬奇来自意大利。列奥纳多·达·芬奇平时手里拿着的东西是武士刀。武士刀的原产国是日本。答案是“日本”。

读万卷书

来自DeepMind在2022年3月发布的论文Chinchillla[5],它针对训练数据量,模型参数量,以及数据训练量进行实验,得出一些结论:

  • 更长的训练时间,更多token,能提升模型效果
    学习更多的知识和更多训练更为重要
  • 大模型的参数量和性能之间存在幂律分布
    学到一定程度之后,进步就越来越慢了
  • 训练时token越多,模型效果越好
    作者认为模型的大小与训练token量应等比增加。
    从这个角度出发,作者将模型从280B参数降到了70G,用更多token训练模型,模型效果没有下降,反而还有些提升。
    从人的角度看,不需要太过纠结于拟合当前的知识和存储量,更重要的是扩展知识面,另外应该多“思考”。

行万里路

众所周知,GPT-3.5没有相关论文,而GPT-4的论文[1]主要介绍了模型效果,而没有具体实验的技术和模型细节。
从实验来看在MMLU测试中,之前模型通过种种优化,一般都在70分左右,最好也只有75分,而GPT-4达到了86.4分,其中强化学习功不可没。

GPT-3.5说它的结构与InstructGPT(2022-03)[6]一致,而InstructGPT主要的进步就是:RLHF(基于人类反馈的强化学习),它与之前的有监督学习和无监督学习不同的是通过模拟环境下试错,拥有了更长远的“眼光”。
当然,这个阶段的AI也不可能一家独大,最近发布的基于Meta的LLaMA[7]模型优化的经济型模型 ColossalChat[8] 也使用了 RLHF(基于人类反馈的强化学习)已经开源并且开放了几乎是即下即用的github下载,听说前两天发布的 Dolly[9] 单机模型效果也很好。

知识的互通性

当机器听得懂人话,不再用程序员翻译,更进一步还能听得懂声音,看得懂图片,视频,智力题…… 输出也不限于文字回答,还可能是图片,代码,拆解的方案,推理的步骤。从LLM(大语言模型)到MLLMs(多模态大语言模型)的概念提出之后,又扩展了LLM的用途。所有可说,不可说,无法用语言描述的规律……
23年3月发布了很多ChatGPT周边的应用,比如微软的Visual ChatGPT[10],自身没有训练大模型,只调用现有的图像处理和自然语言模型就实现了很好的带图像的聊天功能,微软的Kosmos-1[11] 结合图像和语言的大模型在智力题,直接识图方面能力也很强。

关于版权

很多训练数据和评测都是公开的,而训练大模型时一般多数数据来自互联网,因此其产出的回答版权归谁,还真不好说。巨头可以不公开模型结构,训练细节,这都是公司的产权,可以不对外开放,但是从互联网上学到的知识训练出的模型,生成的答案,这个版权就不好说了,不止是语言模型,大多数生成模型可能都会遇到这个问题。

一些想法

如果说前两次工业革命解放了人的体力,那么信息和AI就可能解放人的脑力,生产力的变化也会引起社会形态的变化。有点迷茫,忽然想到《双城记》:

这是最好的时代,这是最坏的时代,这是智慧的年代,这是愚蠢的年代;这是信仰的时期,这是怀疑的时期;这是光明的季节,这是黑暗的季节;这是希望之春,这是失望之冬;人们面前应有尽有,人们面前一无所有;人们正踏上天堂之路,人们正走向地狱之门。

参考引用

1 GPT-4 Technical Report
2 LaMDA: Language Models for Dialog Applications
3 Scaling Language Models: Methods, Analysis & Insights from Training Gopher
4 PaLM: Scaling Language Modeling with Pathways
5 Training Compute-Optimal Large Language Models
6 Training language models to follow instructions with human feedback
7 LLaMA: Open and Efficient Foundation Language Models
8 ColossalChat github
9 Dolly download addr
10 Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models
11 Language Is Not All You Need: Aligning Perception with Language Models


http://www.jnnr.cn/a/369182.html

相关文章

安装Ubuntu双系统

本文为自己安装记录回顾用 1、下载想要安装的 Ubuntu 系统 https://ubuntu.com/download/desktop 2、制作U盘启动盘,并在win10的 磁盘管理 中为Ubuntu腾出磁盘空间 插上U盘,打开制U盘启动盘的软件 ,选择要烧录的U盘以及系统镜像文件&#xff…

正则表达式-运算符优先级和匹配规则

文章目录一、正则表达式-运算符优先级二、正则表达式-匹配规则总结一、正则表达式-运算符优先级 正则表达式 - 运算符优先级 正则表达式从左到右进行计算,并遵循优先级顺序,这与算术表达式非常类似。 相同优先级的从左到右进行运算,不同优先…

【CE】Mac下的CE教程Tutorial:基础篇(第5关:代码查找器)

▒ 目录 ▒🛫 导读开发环境1️⃣ 第五关:代码查找器翻译操作步骤🛬 文章小结📖 参考资料🛫 导读 开发环境 版本号描述文章日期2023-03-操作系统MacOS Big Sur 11.5Cheat Engine7.4.3 1️⃣ 第五关:代码查…

mysql主从复制原理及一主一从搭建过程—2023.04

文章目录一、MySQL主从复制介绍1、主从复制概念2、为什么要做主从复制3、主从复制原理4、主从复制形式5、主从复制主要用途二、MySQL一主一从搭建1、准备工作2、MySQL主从复制部署流程1. 关闭防火墙,两台主机都操作2. 修改配置文件,两台主机都操作3. 修改…

Randomized Response论文笔记

1.论文背景 1.1 主要思想: 利用对敏感问题回答的不确定性对原始数据进行隐私保护. (用撒谎来掩饰) 1.2 核心问题: 在回答隐私问题时,很多人不愿意回答或者是随机回答,因此统计结果的误差通常很难估计. …

蓝桥杯30天真题冲刺|题解报告|第三十天

大家好,我是snippet,今天是我们这次蓝桥省赛前一起刷题的最后一天了,今天打了一场力扣周赛,前面3个题都是有思路的,第三个题只过了一半的案例,后面看完大佬们的题解彻悟,下面是我今天的题解 目录…

由于链接地址长度过长引起的”HTTP Error 400. The request URL is invalid”错误解决办法:修改注册表

网站中,设计了一个批量搜索的功能,用户可以输入多个关键词进行批量查询搜索,但不出意外的话还是出意外了,有些用户可能会输入 N 多个关键词,我为了性能等考虑,会限制个数,比如每次批量查询仅限 …

Java 深入理解Servlet

动态资源与静态资源区别 servlet三及相关接口简介servet 执行过程servlet路径映射servlet生命周期(重点) --理解(重点)Servlet自动加载Servlet线程安全Servlet相关接口详解ServletContext对象 --知识点 一、Web项目结构 |- WebRoot : web应用的根目录…

C的实用笔记36——几种常用的字符串处理API(一)

0、const关键字 1、知识点:const是与存储相关的关键字,用作常量声明,修饰普通变量和指针变量,表示只读。const修饰普通变量:,修饰后变量从可修改的左值变成不可修改的左值 const修饰指针变量:分…

全渠道客户体验:战略和优势

我们都知道现代营销的全渠道方法至关重要。您了解如何与客户建立关系。您甚至可能确切地知道您的客户想要什么。那么怎么样提供一致的全渠道客户体验呢?究竟什么是“全渠道客户体验”? 让我们从基础开始,如果您利用全渠道营销,您的…

json-server模拟后端接口

一、部署模拟后端接口环境 1.安装json-server npm i json-server -g 2.查看json-server的版本 json-server --version 3.在项目的根目录新建json文件存放接口数据 4.使用命令运行接口 #加端口号 json-server --port 8080 test.json #不加端口号 json-server test.json 5.认识接…

Python基础常见面试题总结

基础知识题 1、深拷贝和浅拷贝的区别是什么? 深拷贝是将对象本身复制给另一个对象。这意味着如果对对象的副本进行更改时不会影响原对象。 浅拷贝是将对象的引用复制给另一个对象。因此,如果我们在副本中进行更改,则会影响原对象。 **2、能…

分享 10 个 Tailwind CSS UI 站点,助你快速启动项目

Midjourney 创作,未来UITailwind CSS 是一个为快速创建定制化 UI 组件而设计的实用型框架。与其他 CSS 框架或库不同,Tailwind CSS 组件没有预先设置好样式。相反,您可以使用 Tailwind 的低级实用类来为 CSS 元素设置样式,如 marg…

【工程实践】飞马SLAM100三维数据处理

0 设备信息 有兴趣的伙伴可以去参照官网信息,网址https://www.feimarobotics.com/zhcn/productDetailSlam100 官网标称: 项目Value激光视场角270360绝对精度5cm相机分辨率3500万pxs点频320kpts/s最大测距120m 1 采集数据文件介绍 在SN_XXXX文件夹之下…

基于html+css的图片放大展示

准备项目 项目开发工具 Visual Studio Code 1.44.2 版本: 1.44.2 提交: ff915844119ce9485abfe8aa9076ec76b5300ddd 日期: 2020-04-16T16:36:23.138Z Electron: 7.1.11 Chrome: 78.0.3904.130 Node.js: 12.8.1 V8: 7.8.279.23-electron.0 OS: Windows_NT x64 10.0.19044 项目…

Flink从入门到精通之-04Flink 运行时架构

Flink从入门到精通之-04Flink 运行时架构 我们已经对 Flink 的主要特性和部署提交有了基本的了解,那它的内部又是怎样工作的,集群配置设置的一些参数又到底有什么含义呢? 接下来我们就将钻研 Flink 内部,探讨它的运行时架构&…

图书馆管理系统(Java编写,思路及源代码)

如果你已经学习了Java的三大特性(封装、继承、多态)及接口,那么你就可以尝试这个编写这个图书馆管理系统小项目,这个小项目主要的作用还是用来巩固Java的三大特性及接口的学习。(我前边的几个博客中也详细介绍了三大特…

Qt文档阅读笔记-Tetrix Example解析

本文的俄罗斯方块实例官方的一个经典实例。 俄罗斯方块这个游戏就是从顶部落下方块到底部,把每行都填充满。当一行被填充满,这行就会被移除,玩家就会获取分数。顶部的方块都会依次落下,如果有多行被填充满了,那么会移除…

ASEMI代理NXP汽车芯片MC34PF3001A7EP

编辑-Z 用于i.MX 7和i.MX 6 SoloLite/SoloX/UltraLite处理器的电源管理集成电路(PMIC) MC34PF3001A7EP是一款SMARTMOS电源管理集成电路(PMIC),专为使用NXP i.MX 7和i.MX 6 SoloLite/SoloX/UltraLite应用处理器的常开应…

ChatGPT 本地部署及搭建

这篇简要说下清华开源项目 ChatGLM 本地部署的详细教程。清华开源项目 ChatGLM-6B 已发布开源版本,这一项目可以直接部署在本地计算机上做测试,无需联网即可体验与 AI 聊天的乐趣。 项目地址:GitHub - THUDM/ChatGLM-6B: ChatGLM-6B&#xf…