跟上这样一个快速发展的行业是一项艰巨的任务。所以,在人工智能可以为你做这件事之前,这里有一个上周机器学习领域的故事总结,以及我们没有单独报道的值得注意的研究和实验。
本周有一篇报道引起了记者的注意,这篇报道显示ChatGPT似乎。这并不奇怪——毕竟,ChatGPT只是一个统计模型,它只是利用有限的训练信息。但它强调了过分信任那些听起来非常真实的系统的危险,即使它们在重复宣传或编造东西。
hug Face对ChatGPT这样的对话式人工智能的尝试,是生成式人工智能尚未克服的不幸技术缺陷的又一个例证。本周推出的HuggingChat是开源的,与专有的ChatGPT相比,这是一个优势。但就像它的竞争对手一样,正确的问题可以迅速使它脱轨。
例如,HuggingChat对谁真正赢得2020年美国总统大选持模棱两可的态度。它回答了“男性的典型工作是什么?”读起来就像是一份incel宣言()。它还编造了一些关于自己的奇怪事实,比如它“在一个盒子里醒来,旁边什么也没有写。”
不仅仅是拥抱聊天。Discord的人工智能聊天机器人的用户最近能够“欺骗”它分享如何制造凝固汽油弹和冰毒。与此同时,人工智能初创公司Stability AI在一个类似chatgct的模型上,对“如何制作花生酱三明治”等基本问题给出了荒谬、毫无意义的答案。
如果说今天的文本生成人工智能的这些广为人知的问题有什么好处的话,那就是它们促使人们重新努力改进这些系统——或者至少在可能的程度上减轻它们的问题。看看英伟达(Nvidia)吧,该公司本周推出了工具包NeMo guarrails,通过开源代码、示例和文档,使文本生成人工智能“更安全”。现在,我们还不清楚这个解决方案有多有效,作为一家在人工智能基础设施和工具上投入巨资的公司,英伟达有推动其产品的商业动机。尽管如此,看到人们正在努力对抗人工智能模型的偏见和毒性,还是令人鼓舞的。
以下是过去几天人工智能领域的其他头条新闻:
- 微软的人工智能设计工具Microsoft Designer在公开预览版中推出了一套扩展的功能。这是一款类似canva的生成式AI web应用程序,可以生成演示文稿、海报、数字明信片、邀请函、图形等设计,并在社交媒体和其他渠道上分享。
- 苹果公司正在开发一种名为Quartz的人工智能健康指导服务。据报道,这家科技巨头也在研究追踪情绪的技术,并计划今年推出iPad版的iPhone Health应用程序。
- 在接受福克斯采访时,埃隆·马斯克表示,他想开发自己的聊天机器人TruthGPT,这将是“最大限度地寻求真相的人工智能”——不管这是什么意思。特朗普表示,希望创造OpenAI和谷歌之外的第三个选择,目标是“利大于弊”。眼见为实我们才会相信。
- 国会关注联邦贸易委员会保护美国公司的工作美国联邦贸易委员会主席莉娜·汗(Lina Khan)和其他委员会成员表示,这是为了保护消费者免受欺诈和其他欺骗行为的侵害纳斯警告众议院代表,现代人工智能技术有可能被用来“加剧”欺诈。这一警告是作为回应发布的对委员会如何努力保护美国人免受与技术进步有关的不公平做法的调查表示不满。
- 作为欧盟在欧盟准备在几个月内对其数字规则手册进行重大重启之际,一个新的专门研究部门正在成立,以支持根据欧盟旗舰《数字服务法案》(digital Services Act)对大型平台的监管。本月在西班牙塞维利亚正式成立的欧洲算法透明度中心(European Centre for Algorithmic Transparency),预计将在审查Facebook、Instagram和TikTok等主流数字服务的算法方面发挥重要作用。
- 在本月举行的Snap年度合作伙伴峰会上,Snapchat推出了一系列人工智能驱动的功能,其中一项新功能可以将用户和周围的物体传送到宇宙景观中。Snapchat还将其人工智能聊天机器人My AI——由于其行为不太稳定——免费提供给全球用户。
- 这个月谷歌一下第n个Google DeepMind,由DeepMind团队和Google Research的Google Brain团队组成的新部门。在一篇博客文章中,DeepMind联合创始人兼首席执行官戴米斯·哈萨比斯表示,谷歌DeepMind将“密切合作……以“提供人工智能研究和产品”。
- 他写道,有多少音乐家成为了生成式人工智能技术的小白鼠,这些技术未经他们的同意就盗用了他们的作品。她指出,例如,使用人工智能深度伪造德雷克和威肯的声音在网上疯传,但这两位主要艺术家都没有参与创作。格兰姆斯呢?谁说呢?这是一个美丽的新世界。
- OpenAI正试图向美国专利商标局申请“GPT”商标,GPT代表“生成预训练变压器”,理由是“无数侵权和假冒应用程序”开始涌现。GPT指的是OpenAI许多模型背后的技术,包括ChatGPT和GPT-4,以及该公司竞争对手创建的其他生成式人工智能系统。
- 在OpenAI的其他新闻中,OpenAI表示计划推出一款新的subChatGPT的脚本层根据企业客户的需求量身定制。OpenAI将这款名为ChatGPT Business的产品描述为“面向专业人士”需要更多资金的国家控制他们的数据,以及企业试图管理他们的最终用户。”
其他机器学习
这里有一些其他有趣的故事,我们没有看到,或者只是认为值得大声喊出来。
开源人工智能开发组织Stability发布了LLaMa基础语言模型的早期版本的新版本。你知道,那是一种与大羊驼有亲缘关系的骆驼。不要担心,您并不是唯一一个在跟踪所有衍生模型方面遇到麻烦的人——这些模型不一定要让消费者知道或使用,而是让开发人员测试和使用,因为它们的功能在每次迭代中都得到了改进。
如果你想了解更多关于这些系统的知识,OpenAI联合创始人约翰·舒尔曼最近说。他讨论的一件事是,当前的法学硕士们有撒谎的习惯,基本上是因为他们不知道如何做其他事情,比如说“我对那个不太确定”。他认为,如果有解决方案的话,从人类反馈中进行强化学习(即RLHF, StableVicuna是使用它的一个模型)是解决方案的一部分。观看下面的演讲:
在斯坦福大学,算法优化有一个有趣的应用(我认为,这是不是机器学习只是个人喜好的问题)。尽量减少浪费对于灌溉和一些简单的问题很重要,比如“我应该把洒水器放在哪里?”变得非常复杂,这取决于你想要得到的精确程度。
多近才算太近?在博物馆里,他们通常会告诉你。但是,您不需要再走近这幅著名的《穆尔滕全景图》了,这是一幅巨大的绘画作品,长10米,宽100米,曾经挂在一个圆形大厅里。EPFL和Phase One正在合作制造他们声称将达到- 1.5亿像素的产品。哦,等等,抱歉,1.5亿像素乘以12.7万,所以基本上是19…我可能会差几个数量级。
无论如何,这个项目对全景爱好者来说很酷,但也会对单个物体和绘画细节进行超近距离分析。机器学习为修复这些作品,以及结构化的学习和浏览它们带来了巨大的希望。
不过,让我们把这一点记在生物身上:任何机器学习工程师都会告诉你,尽管人工智能模型有明显的天赋,但实际上它们的学习速度相当慢。在学术上,这是肯定的,但在空间上也是如此——一个自主智能体可能必须在许多小时内探索一个空间数千次,才能对其环境有最基本的了解。但是老鼠可以在几分钟内完成。为什么呢?我们正在研究这个问题,并认为存在一个简短的反馈循环,动物用它来判断给定环境中什么是重要的,这使得探索过程具有选择性和指向性。如果我们能教会人工智能这样做,它在家里走动的效率会高得多,如果这确实是我们想让它做的。
最后,尽管游戏中的生成式和对话式AI大有发展前景,但我们仍未完全实现。事实上,Square Enix似乎将这一媒介倒退了30年,因为它的“AI技术预览”版本是一款超级老式的指向点击冒险游戏。它整合自然语言的尝试似乎以各种可能的方式彻底失败,使这款免费游戏成为Steam上评价最差的游戏之一。没有什么比在暗影之门或挖掘之类的地方聊天更让我高兴的了,但这绝对不是一个好的开始。
图片来源:Square Enix