#25 人人都可以成为 AI 工程师

0xinhua 发布于

DALL·E

Justin Jay Wang × DALL·E

Hi,见信好,这是 321来信发出的第 26 封信,这一期 AI 相关的内容会比较多。

本期包含以下内容:

  • YC、OpenAI 背后的天选之子 Sam Altman,ChatGPT 是互联网的有损压缩
  • 巨大摇摆之后,中国疫后社会重建的支点, AI 工程师变成了 Prompt 工程师
  • 关键字:ChatGPT prompt工程师 AI Sam Altman prompt 项飙

💡 想法

春节后我回到北京开始投入到工作中,到现在整整过了一个多月,最近确实有点忙碌,大部分时间都在编程,最近在看一本技术相关的书 《Go in action》序言中开头的一句话让我很有感触 ,“当人们聚在一起,纯粹是为了让世界变得更好的时候,往往也是他们处于最佳状态的时候”。最近大概也是这样的一个感受,不管是生活还是工作上,最近我的状态一直很好,我跟小伙伴在做一款很有意思的产品,不出意外这月底我们会发布新的版本,如果订阅 newsletter 的读者中有从事互联网行业,特别是编程工作的程序员,可以关注一下我后面推送的来信,我会向你们介绍我做的东西,并且期待你们利用它去实现自己的想法做一些很酷的东西,同时如果方便也可以反馈问题和建议,帮助我们去迭代下一个版本。

这期我想分享一下最近使用 ChatGPT 的一些体验以及想法,人人都可以成为 prompt 工程师。

在之前的几封来信里,我有介绍过当前最火爆的语言模型 ChatGPT,这段时间你也一定被各种 ChatGPT 新闻刷屏了,OpenAI 最近已经开放了最新的 gpt-3.5-turbo 模型,我们第一时间购入了更稳定、更多特征的 ChatGPT Plus,并且尝试用它的接口来做一些工具以及有趣的事情,例如我们搭建了基于 ChatGPT 的飞书机器人,在飞书群里帮忙回答问题,我开始利用它纠正日常英语拼写问题回复用户邮件,目前它基本已替代了我经常使用的一款英语写作助手 Grammarly,我的同事还把它集成到了我们的项目 issues 管理流程中,通过分析问题描述帮忙分类问题的类型,自动标记成 featrue 或 bug,以及修复问题的紧急程度,如果是 bug 还可以给出相应的修复建议;我们利用它分析日志报错,查找对应文档内容并给出报错原因;通过快捷指令 + Siri 能实现在 iPhone 中与 ChatGPT 语音对话。

在我的日常编码以及写文档工作中,AI 也充当了一个助手的角色,我让它帮我画文档中的时序图、编写代码的测试用例、编写匹配一些复杂条件的正则表达式(你可以理解为一套字符串匹配规则),写一个漂亮而又准确的正则对很多工程师来说一直不是一个很容易的事情,有了 ChatGPT 我再也没有自己写过正则表达式;而在日常生活中,ChatGPT 也出乎意料地好用,我让它帮忙规划旅行景点路线,出旅行攻略,当我不知道几点出发去机场时,我甚至让它计算规划一下出行时长和交通路线;我用它帮助朋友给毕业设计取了很棒的题目;当我去准备健身房但不知道该练哪些动作时,我第一时间想到的是让它帮我做个锻炼计划。

ChatGPT-gym

ChatGPT 离通用型人工智能还很远,但它给我们带来更多的可能性以及想象力,随着大语言模型的发展,AI 技术进一步影响我们的日常工作生活。在 OpenAI 公布 API 之后,已经诞生了一大批衍生产品,例如能检索 PDF 文件并且提供内容概括的 chatpdf,上传 pdf 能让你通过跟它对话非常准确的从文章获取信息;在 Twitter 上被人们广泛转发的 roomGPT 这个项目使用人工智能根据你当前房间照片生成新的设计。看过其中的一些项目的源码后会发现现在接入或使用 AI 的门槛已经很低,例如我最近在使用的一个辅助工具 aicommits ,它是一个终端的 CLI 辅助工具,使用 ChatGPT 根据你的代码变更生成简要描述当作 changelog,有了它可以不用自己写提交消息了(我们已经把它用在了生产环境),当查看这个这个项目的源码后,你会发现最核心的代码是下面的这一句 prompt:

Write an insightful but concise Git commit message in a complete sentence in present tense for the following diff without prefacing it with anything, the response must be in the language ${locale}:\n${diff}`

翻译:对于下面的提交差异,用一个完整的句子写一个有洞察力但简洁的 Git 提交消息,不要加上任何前缀,响应必须是 xxx 语言

prompt 翻译成中文是提示,你也可以理解成语境,也就是说如果你想让 AI 更准确的帮你完成任务,你需要提供一个语境告诉它你想要它怎么帮你,在 ChatGPT 中,Prompt 指的是输入给 AI 模型作为开始生成响应的文本。它是用户输入的一段文本,这段文本将被用作对话的起点,以启动模型对话的生成过程。Prompt 的质量和清晰程度对于模型的生成结果非常重要,因为模型将根据 Prompt 的内容来理解用户的意图和上下文,从而生成相应的响应,它将决定你的答案是否清晰,明确,全面而且有趣。prompt 是这些 xxxGPT 衍生应用的灵魂,跟生活中提问的艺术是一样的,问题问得好,事情就解决了一半,我们在利用 ChatGPT 做类似产品的时候只需要构建或调教一个准确的能完成对应任务的 prompt 即可,AI 工程师变成了 prompt 工程师,并且人人都可以成为 prompt 工程师。

在互联网技术诞生的时候,我们说所有的传统行业、生意都值得并且可以使用互联网思维来重做一遍,那接下来所有的互联网产品也可以利用 AI 技术重做一遍。

💡 碎片

  • 福布斯记者统计了最受欢迎的 ChatGPT prompts,排名第一的是帮我生成文章摘要 ChatGPT Prompts
  • 北京街头汽车玻璃上爱的留言,他/她在生活中应该也是一个很有爱的人 I love you on car

👍 推荐

📃 项飙、吴婷|巨大摇摆之后,中国疫后社会重建的支点是什么? - 文化纵横

中国社会有一个很大的特点,我称之为“去记忆”,“去记忆”的意思,不是忘记,而是刻意的不去记住。

发现我是项飙老师的的粉丝,很喜欢他的观察、讨论风格,这篇文章有两个很触动我的地方,去记忆化和被忽视的支撑城市运作的那群人。因为疫情中国社会经历了三年的冲击和停摆,不管是社会还是人的心理层面,都需要进行重建,人们都想尽快翻篇,但因为需要勇气去填补空白,大多数人都不愿意去揭开伤疤。另外那些原本被人们忽视的群体,成为非常态时期支撑城市低限度运行的支撑力量,比如城市环卫人员、外卖小哥、超市工作人员,药店员工,这些在非常态下维持城市运行的群体,他们的短暂地被看见,而疫情过后,在现实中他们的工作生活环境并没有得到相应的改善。

项飙和吴婷就中国社会在新冠疫情之后的发展趋势以及应对疫后社会重建的支点进行了讨论,项飙认为,尽管中国有漫长的的历史传统,但是对于一些短时段的事件,社会有“去记忆”的特征,而这样的“去记忆” 实际上会造成很多问题,首先就是不能很好的汲取教训;其次就是个人心理会很纠结,理性层面想要“去记忆”,但身体还会记住。文章提到疫情对中国经济、社会和政治产生了深刻的影响,在这种情况下,寻找支点以推动社会重建至关重要,这些支点包括以下几个方面:科技创新、公共服务、人才培养、文化交流和区域发展,通过这些支点,中国将能够建立更加稳固和可持续的社会和经济体系。中国社会的重建可以以“重建附近”为基础,同时需要正视疫情期间流动再分配的进程,其目标是建设一个“韧性社会”,一是保证必需的自由度,二是重建附近,特别是社会的公共性,三是政府适度干预引导韧性社会的形成。

📃 Sam Altman's Manifest Destiny - newyorker

中文版 Sam Altman: YC、硅谷与人类未来的天选之子?

这篇文章让我了解了掌管 YC、OpenAI 两个科技公司背后的 Sam Altman 是一个怎么样的人,以及 YC 的一些创业理念:

Paul Graham 2009 年 4 月在他著名的博客里写道关于为什么选择了他接任 Y Combinator 的主席:他心目中最好的五个创始人里——除了你能想到的 Steve Jobs 或 Google 的 Larry & Sergey——Sam Altman 的名字也赫然在列。Paul Graham 这么说:「诚实地讲,在给创业公司建议的时候,我提起来最多就是两个人:Steve Jobs 和 Sam。 当我遇到设计问题的时候,我会问自己:Steve Jobs 会怎么做?而遇到战略和野心问题的时候我想的是:Sam 会怎么做?

Sam Altman 在斯坦福大学辍学后创立了基于地理信息位置的应用 Loopt,后来把它卖掉(投资人还亏了些钱);他从小就是个特殊的孩子,Sam Altman 16 岁时和父母出柜,Altman 在 Loopt 的联合创始人之一 Nick Sivo 曾经是他的男朋友,他们在一起九年时间,但公司被卖之后两人分手了。还曾在一次本地教会组织的抵制同性恋的集会中,站出来向母校发声说:" 我是同性恋。而你们是想变成一个压抑个性的地方,还是想真正对不同的群体开放你们的心胸?"

YC 对创业公司的要求非常简单,但要做到也很难。一,做人们想要的东西(YC 最重要的口号:make something people want)——这是 Graham 的一个口头语,被印在了给创业者的灰色 T 恤上, 二 你要做的所有事情就是和你的客户交流,然后打造产品。预估一家创业公司成功几率的公式差不多类似于:理念 x 产品 x 执行 x 团队 x 运气,其中运气是一个位于 0 到 10000 之间的随机数字。如何衡量产品质量,Altman 认为客户重复使用率和留存率就行了,你不需要发明什么新的复杂的指标。另外永远想着如何把你现在做的事后面多加一个 0,但不要比这个想得再远了

📃《ChatGPT 是互联网的有损压缩》- newyorker

openAI 的聊天机器人提供释义,而谷歌提供引述。大型语言模型生成的文本在网络上发布得越多,网络本身就变得越模糊 - Ted Chiang

美籍华裔科幻作家特德·姜(Ted Chiang)在《纽约客》上发表文章,表达了他对时下大热的人工智能 ChatGPT 独特见解。文章提到了一个很有意思的例子: 2013 年,德国一家建筑公司的工人们注意到他们的施乐复印机有一些奇怪的地方:当他们复制一份房子的平面图时,副本与原件存在微妙但显著的差异。在最初的平面图中,每个房子的三个房间都有一个矩形来说明其面积:房间分别为 14.13㎡,21.11㎡ 和 17.42㎡。然而,在复印件中,所有三个房间都被标记为 14.13㎡。原来在 Xerox 复印机中使用的是称为 jbig 2 的有损压缩格式,专为黑白图像而设计,为了节省空间,复印机识别图像中看起来相似的区域,并为所有这些区域存储一个副本;当文件被解压缩时,为了节省空间,它会重复使用该副本来重建图像。

Ted Chiang 在文章中把 ChatGPT 看作是 Web 上所有文本的有损压缩,它保留了 Web 上的大部分信息,就像 jpeg 保留了高分辨率图像的大部分信息一样,却无法查找精确的数据序列。这种与有损压缩的类比不仅仅是一种理解 ChatGPT 通过使用不同的词汇重新打包 Web 上找到的信息的方法,PEG 是一种有损压缩图像格式,在压缩过程中会舍弃部分次要数据,解压后的图像和原始图像不同,但非常接近,如果我们只需要让它概述或重新包装已有的信息,大部分情况下够用了,将 ChatGPT 形容为模糊 JPEG 可以帮助我们更好的理解它能擅长做什么。

以上就是第 #25 期的全部内容了,感谢你读到这里,喜欢别忘了订阅及转发。

Made with ❤️ by @0xinhua

上期来信:

#24 👀 Body