Friday, January 27, 2023

解滨:美国将要爆发的一场新的技术革命

 (万维博客,2023-01-25)

       虽然硅谷的裁员风暴越刮越凶猛,美国的智库在疯狂叫嚣“美国不行了,被中国打败了”,真实情况却是: 美国正在孕育著一场新的技术革命,一场将彻底改变人类思维方式的革命,一场在将在多个行业和领域带来翻天覆地变化的革命! 这就是美国在人工智能即AI方面将引领人类的发展,带来一场翻天覆地的变革。 

       AI行业的业者都清楚,美国五年前还是这个行业的龙头老大,但2017年是个分水岭: 中国在AI领域的论文数量开始超越美国,去年前年中国的AI方面的论文数目可以说是吊打美国。中国不仅仅是论文数量远远超越美国,论文的质量也在稳步上升,被引用的次数也越来越多,这方面也开始吊打美国。

       虽然美国一度是这个行业的龙头老大,但中国一直抱有成为世界人工智能超级大国的雄心壮志。鉴于这一目标,中国国务院几年前就宣布到 2030 年成为 1500 亿美元的 AI 全球领导者。这个目标不仅雄心勃勃,而且看起来可以实现,因为中国已经是 AI 研究的全球领导者。中国发表了多篇关于深度学习的研究论文,数量远超其他领先国家。而中国最大的也是独有的有利条件就是其使用互联网的人口(约 7.5 亿人)世界第一,产生了大量需要处理的数字数据。更重要的是,中国并没有任何保护人权的法律,在使用AI进行有可能侵犯人民隐私的应用上,中国可以毫无顾忌地进行开发,而别的国家则不行。人脸识别技术就是最好的例子。 

       相比之下,在成为人工智能超级大国方面,美国虽然正在与中国展开激烈竞争,却看似处于劣势。凭借美国成熟的科技文化,该国已从 100 亿美元的风险资本中获益,流向 AI 方向。但这个投资可能只是中国的一个零头。而且最近几年美国政府减少了对AI的资助,尤其是疫情以来美国对国际研究专业人员的移民限制趋于严格,美国这方面的落后日趋严重。

       看来美国在AI这个领域已经是落花流水春去也。人未走,茶已凉。中国至少可以在AI领域宣称“东升西降”,西方也无话可说。

       然而就在美国山重水复疑无路的时候,美国旧金山的一个开发人工智能的小公司OpenAI却硬是杀出一条血路,柳暗花明,平地一声春雷,向世界推出了一个AI平台: ChatGPT! 

       这是人类第一次任何网民都有机会直接和AI交流,使用AI帮自己做点事情,从疾病答疑到编程,从食谱到制定锻炼计划,甚至为儿童创建睡前故事,ChatGPT几乎无所不能。ChatGPT是去年1130日正式向公众开放的,一个星期后其用户就超过了100万!用户吃惊地发现, ChatGPT几乎可以回答任何刁钻古怪的问题,提供任何思路,帮助用户提供任何方案。 简而言之,ChatGPT是一种参与对话的AI模型,有点像具有AI的聊天机器人,类似于一些公司的客户服务网站上的自动聊天服务。ChatGPT 中的“GPT”指的是“生成预训练转换器”(Generative Pre-training Transformer ,指的是 ChatGPT 处理语言的方式。它与聊天机器人的不同之处在于,ChatGPT 是使用来自人类反馈的强化学习 reinforcement learning from human feedback - RLHF 进行训练的。RLHF涉及使用人类AI培训师和奖励模型将ChatGPT开发成能够挑战不正确假设,回答后续问题和承认错误的机器人。这是目前聊天机器人无法做到的。ChatGPT甚至是一个很好的投资理财顾问!

       和任何新开发的技术一样,有些人自然会想到使用ChatGPT做坏事! 比较突出的一个应用,就是黑客请ChatGPT撰写恶意代码和钓鱼软件,好像ChatGPT的编码水平并不低于一个职业黑客。另一个恶意应用,就是学生使用ChatGPT帮自己写论文。据说其论文水平完全就不是外行的水平。我试过让ChatGPT写一篇关于俄罗斯侵占乌克兰前后俄罗斯对乌克兰进行的黑客攻击的短论文。ChatGPT说它的知识体系只停留在2021年,那个时候俄罗斯还没有入侵乌克兰,所以无法写出符合实际的评论,但却可以根据那之前的案例进行评述。论文在不到一分钟的时间就完成了,根据其引用的之前的案例来看,准确性可以说接近100%

       这下子是不是很糟糕了,以后学生都不再自己去做研究了,而是让AI去帮助自己写论文!去年11月下旬ChatGPT公布以来,有报道称学生使用ChatGPT AI 编写的作业伪装成自己的作业。但道高一尺魔高一丈! 一位华人小弟,普林斯顿大学年仅22岁的大四学生Edward Tian开发了一个应用程序,用于检测文本是否由ChatGPT编写。

       ChatGPT的意义究竟何在? 我想回顾一下互联网发展史中一些有趣的事情,进行一个对比。记得二十多年前我在一个出版公司新近投资建立的互联网公司里当网管,后来提拔为网络总监。 那个时候每开发出一个新的网站后最大的心病就是担心没人过来浏览新的网站。没有流量就没法赚钱。要流量就只好靠花钱去别的网站打广告以及讨好搜索引擎了。当年最大的搜索引擎是Yahoo,但Yahoo其实不过是列表而已,即所谓的directory service,如同图书馆目录那样,并非真正的搜索。后来出现了Lycos, InfoSeek等新一点的搜索引擎,其技术核心乃是关键字的match 当年最热门的浏览器Netscape也搞了一个自己的搜索引擎。很快,就出现了webcrawler 这样一个靠index 搜索的新概念。记得当年写代码的时候都要加上特别的几行代码以利于人家过来crawindex每当我们的防火墙logs显示出某个webcrawler过来抓取网页,我都特别高兴。然而谷歌的出现才是真正的飞跃,革命性的飞跃,真正实现了靠谱、高效的搜索。那是1997年的秋天,谷歌横空出世,那场革命一直延续至今。有了谷歌,我不必再一篇篇文章、一本本书读过去寻找答案了,谷歌在一秒钟内可以帮我找到答案。谷歌之后新出现的搜索引擎例如Duckduckgo 之类的不过是在抄作业。像百度那样的连抄作业都不认真,一知半解就拿出去赚钱,靠著互联网防火墙一家独大。

       使用过ChatGPT的都知道,目前这个版本只是免费试用版,其知识库的更新停步在2021年。 随后将要面向大众和各行各业推出的付费专业版肯定要比目前这个免费试用版本高级不知多少倍。

       ChatGPT的横空出世有如当年的谷歌但远远超过了谷歌。谷歌只能根据输入的搜索词然后找出对应的现成的答案,而ChatGPT则会有自己的想法和已有的答案以及客户的喜好提供不同的答案和方案。目前ChatGPT只不过是一个具有强大的人工智能的聊天机器人,但很快这一类的人工智能会和各行各业的各个环节建立出interface,从高端制造业到医药创新,从职场培训到销售模型的建立,从蛋白质研究到飞机发动机的改进,很快这种人工智能就会通过各种界面联通到各个不同的领域。 这类的实质性的创新和应用将经如同闸门放开,应用到各行各业。源源不断的创新又开始了。就以图书馆检索这个领域为例,目前只不过是根据用户输入的关键词找出一大堆相关的书籍,然后客户自己去选取。但在搜索引擎跟ChatGPT建立界面后,ChatGPT将会在一大堆相关的书籍中告诉你哪几本最能回答妳的问题而另外几本可以忽略,而且甚至会建议你去读另外几本书,虽然那并不直接和课题有关但可以提供更有意义的信息并给予某种提示或启发。再如一个用户要想让ChatGPT帮忙写一个菜谱,ChatGPT会询问用户的平日的饮食喜好,对不同的菜谱进行分析然后推荐最适合客户的菜谱,同时给出卡路里以及告诉客户所建议的菜谱里会不会含有可能导致过敏的食材,甚至会建议如果某些食材难以获得的化,何以用另外一些食材替换。另外一个例子就是ChatGPT可以帮Excel users 充分挖掘Excel 的功能,大大提高工作效率,成为财务人员的好帮手。

       今天的ChatGPT和二十多年前谷歌的诞生一样,一场大革命又开始了! 美国没有躺平,美国将又一次引领世界技术革命!连我这当年跟风特别紧的网管如今都是老掉牙了。

       而且我还想说的是,ChatGPT并不一定就是AI当中真正的大拿。Meta的首席人工智能科学家Ann LeCun说他对ChatGPT并没有留下深刻的印象。这似乎是一个意想不到的回应,但他指出 Meta 有自己的人工智能程序,而且它也取得了长足的进步。例如,Meta 的翻译 AI 可以处理 200 种语言,包括一些口语但没有书面形式的语言。Meta 利用人工智能进行高级研究,并在其社交媒体网络中检测错误信息,当然我怀疑他们是否在使用AI检测“政治不正确”的发言和文章,进行相应的处理。谷歌多年来一直在将人工智能构建到 Android 和谷歌搜索中。但这两家公司都没有向公众开放其人工智能系统的功能。ChatGPTAI第一次对大众开放。但要说ChatGPT是最好的AI,恐怕不符合实际。

       事实上,美国用于预测疫情爆发的 AI几年前就开始进入试运营阶段了。其中一个例子是BlueDot,这是一家对全球传染病威胁进行建模和定位的公司。2016年,BlueDot成功检测到寨卡病毒在美国的爆发。最近,他们在世卫组织确认该病毒出现前九天在湖北地区发现并标记了一组肺炎病例——这是记录在案的 COVID-19 起源!此外,他们正确地预测了未来的震中和COVID-19传播的初始地理轨迹。(they detected and flagged a cluster of pneumonia cases in the Hubei area the documented origin of COVID-19 nine days before the WHO confirmed the emergence of the virus! Additionally, they correctly predicted the future epicenters and the initial geographical trajectory of the spread of COVID-19)美国如Moderna疫苗的研制过程也使用了AI2020年最大的科学突破之一可以说属于DeepMindAlphaFold,该模型能够根据蛋白质的氨基酸序列预测蛋白质的结构。几十年来,预测蛋白质折叠结构的问题一直困扰著生物学家。DeepMind用一个比最好的现有解决方案更快、更便宜的解决方案解决了这个问题,为大约17万个蛋白质结构的测序提供了强大的支持。

       这,就是美国行将爆发的一场新的技术革命!

       目前只有不到1%的大公司广泛使用AI,几年后广泛采用人工智能不再仅仅是科技行业的特权,中小型公司和比硅谷更老的传统企业也可以通过将人工智能整合到他们的业务战略中受益。

       开句玩笑:活在美国你就偷著乐吧!

       最后,回到本文开始:既然中国才是今日AI的领头羊,可为什么不见中国出现如此众多的AI技术应用呢? 实际上中国确实已经有了不少应用,例如人脸识别,中国已经把世界各国远远甩在后头,甚至可以从戴口罩的人群中正确地识别政府想要抓捕的敌人。 中国各地从高层到基层都在认真学习习主席的书和指示。 中国的AI可以正确地识别那些敷衍了事的家伙,向上级汇报谁在认真学习谁在磨洋工,奖勤罚懒,以确保每一个党员、干部和群众时时刻刻和习主席、党中央保持高度一致。中国的这种监控技术是世界各国望尘莫及的。我敢打赌腾讯在监视微信用户的各种发言的时候也使用了AI进行因地制宜、因人制宜的处理。按理说我是反动透顶了,无可救药,但无论我在微信群里发表什么恶毒攻击中国党和政府的言论都不会被封杀。腾讯似乎根据我在微信里的言论分析判断出,即便被封杀我也毫不在乎,而且会变本加厉地在微信之外的场合发表更加反动的言论,于是只好让我胡言乱语恶意攻击党和政府,但在中国的用户即便同在一个微信群里也看不到我的任何发言。别的同在海外的朋友就不得不使用各种替代词绕过监控躲避封杀。而我的几个在中国的老粉红同学们哪怕稍微转发了几篇不那麽热烈拥护党热爱习主席的文章都会被封几个星期。看来腾讯的监控AI早就学会了狗眼看人,可以正确区分不同等级的用户分别进行处理。

       至于中国的海量关于AI的论文,中国一旦重视了任何一项研究,大规模灌水便开始了。 互相抄袭,稍微改动一点内容便是新的一篇论文了。 至于引用,很可能是中国学者之间互相引用,互相吹捧。所以中国在AI的论文数量和被引用的次数,并不能反映出中国现实的AI进步和水准。 其实中国其他行业也大致是这麽个情况。例如,关于生化方面的论文中国也领先了世界,但到实际的药物的研制和开发,例如疫情中急需的药物,中国就差老鼻子了。 所以直到今天中国还在贩卖中医,兜售老祖宗的破烂玩意儿。