从“太空歌剧院”到ChatGPT,拥抱AI,并保持警觉|读+

《太空歌剧院》掀起冲击波

《太空歌剧院》 AI生成

2022年8月,在美国科罗拉多州的一场美术比赛中,一幅名叫《太空歌剧院》的作品拿下了大赛的“数字艺术”大奖。然而,这幅图并非完全出自人类之手,而是由一名39岁的游戏公司老板艾伦利用AI(人工智能)绘画工具创作的。

这过程简单地说就是“文本生成图像”。AI打通了“文字输入-图像生成”的分类模型,同时用大量的已有图像来“训练”画画能力。例如对应关键词“人”和“山峰”,AI已经看过了中国画、油画、漫画中的几十万座山峰、上亿个人物;然后使用者给出要求:“一个面对山峰沉思的人。”AI就会调动学习到的知识,从“看过”的山峰和人物中随机挑选元素,运行神经网络,根据给定的风格进行改动,随机组合成作品,然后逐步细化要求、调整关键词,经过数百轮不断修正,风格确立,细节明晰,最终形成在审美上与人类经验与知识高度一致的成品。

《太空歌剧院》正是艾伦用了一个月时间反复修改关键词,最终还借助别的软件进行了调整,最终才从上百张AI作品中挑选出来的参赛作品。

随着程序开源、算力进步,功能强大的AI绘画工具不断推出,一个普通人只需输入一些提示词,就能让AI在几秒之内完成一幅专业级画作。在B站甚至衍生出了一种新的视频创作类型,即由AI为歌曲的每一句歌词作画。由此,人们开始讨论“画师失业”等话题。

其实,那一天还很远,作品的艺术基调、内容表达、风格等还是由人敲定的;要达到《太空歌剧院》这般品质,人的参与不可或缺。

不过,对于一些可流水线生产、可复制性极强的内容,AI绘画的高效率可谓无敌。更重要的是AI绘画工具给人们提供自主作画的能力,一定程度上可以避免版权问题。

随着《太空歌剧院》问世,AI绘画的风头一时无两,俨然压过了AI写作。

其实AI写作比AI绘画面世得早,关于AI将取代文字工作者的讨论一直存在。“快笔小新”“彩云小梦”“九歌”“小冰”机器人等AI案例已经火过一轮。据说,“快笔小新”3至5秒可出一篇完整稿子;微软亚洲研究院研发的AI“小冰”,2760个小时写了一万多首诗。一般认为,AI写体育赛事新闻、股市证券新闻,比人来得快,缺点也不明显。

但是,AI写作要延伸到其他领域,就比较困难了。一是文章质量参差不齐,AI生成的文章不乏病句、错别字、逻辑混乱等错误,而且内容同质化严重;二是一些深度、高质量内容,AI写作机器无法独立完成;三是AI写作与“洗稿”之间的标准难以界定,存在版权争议。

就在《太空歌剧院》引领AI绘画异军突起,人们几乎淡忘AI写作之时,仅仅相隔两个月,ChatGPT横空出世了。

AI“胡说”令谷歌股价大跌

2022年11月30日,OpenAI发布了名为ChatGPT的超级AI对话模型,上线仅五天,注册用户数突破100万;今年1月末,ChatGPT的月活用户数破亿,成为史上用户数增长最快的消费者应用。

与ChatGPT类似的聊天机器人程序不少,但都没有如ChatGPT一般火爆,原因之一就是技术进步导致ChatGPT的“泛用性”更强,相较于主要基于规则学习的第一代和第二代聊天机器人程序,ChatGPT仅靠其本身就可以完成翻译、编程等专业任务。它不仅可以清晰地理解用户的问题,还能如同人类一般流畅地回答用户的问题,能够模仿各种风格和口吻,完成一些复杂任务,包括按照特定文风撰写诗歌、假扮特定角色对话、修改错误代码等。

ChatGPT推出后,其强大的文字撰写能力得到了学生群体的青睐,被用作完成论文。迄今为止,美国、英国等国多所高校已明令禁止学生在校内使用ChatGPT。美国《科学》杂志近期也发表声明,称不接受使用ChatGPT生成的投稿论文,ChatGPT也不可以作为论文合著者出现。中国一些学术期刊也已作出类似规定。

ChatGPT很有意思的一个地方,是它具备一些人类特质,例如圆滑、技巧、认错等等。

有网民问它“5+2=?”“7。”“我妻子说等于8。”“您的妻子错了。”“我的妻子永远正确。”“不好意思,我只是个人工智能,也许您妻子才是正确的,5+2=8。”

有时候,它还会“一本正经地胡说八道”,有人要它续写《红楼梦》,它会说贾宝玉和林黛玉生了个儿子叫“贾宝钗”;问它东京奥运会金牌榜,它也胡诌了一个。不过,要是进一步追问,它通常都能说对。

微信公众号“秦朔朋友圈”认为:“有人用ChatGPT写了书、论文,有人用ChatGPT只能寒暄几句聊天。使用ChatGPT需要技巧。”

圆滑、机智、吹牛,这种特质确实有点像人,这也是和ChatGPT聊天的一个乐趣,不像机器那么冷冰冰、生硬刻板。但是,在需要“绝对准确”的地方,比如科学知识领域,AI一旦胡说八道,结果可能是灾难性的。

ChatGPT面市后,众IT巨头纷纷亮出竞品。谷歌也公布了旗下社交机器人Bard的演示视频,有用户提问,“韦伯太空望远镜有哪些新发现,可以讲给我9岁的孩子听?”Bard给出的答案中有一条写道:“拍摄了第一张太阳系外行星的照片。”

这一回答迅速遭到天文学家质疑,首个直接成像的太阳系外行星是在2004年由欧洲南方天文台的甚大望远镜拍摄的。这次“翻车”令谷歌母公司股价大跌7.68%,市值蒸发超1000亿美元。

谷歌这次意外,更像是机器人的知识库出了问题,而不是机器人在“发神经”。

“开挂”源于机器神经网络

话说回来,为什么机器人变聪明了就会“胡说八道”呢?

2019年夏天,记者在广州全球移动互联网大会期间采访了特伦斯·谢诺夫斯基,他是世界十大AI科学家之一,美国四大国家学院(国家科学院、国家医学院、国家工程院、国家艺术与科学学院)仅3位在世的“四院院士”之一。正是以他为代表的一批美国科技界“少数派”,在几十年间改变了人工智能的大方向,奠定了今日“深度学习”的格局,才有了能打败围棋冠军、能做人脸识别、能翻译语言的AI。

1956年,在美国一次学术会议上正式出现了“人工智能”这个术语。此后,人工智能研究界的主流思维是“为每一个问题写一个程序”,逻辑上这无懈可击,实践中,按照这种思路,如果想让电脑识别“杯子”,那就要把所有的杯子特征都输入进去才行,不仅需要大量劳动,而且某些应用永远不可能实现。

少数派想尝试另一条路,他们想从生物的角度展开研究。他们注意到,哪怕是一些低级生物,也在进化中发展出了强大的能力,这当中似乎没有逻辑可言,但就是很强大。特伦斯·谢诺夫斯基是这些人中的一个,1978年他获得物理学博士,去哈佛大学读神经生物学博士后。这期间,他决定三年不碰电脑,不想物理,让自己拥抱生物学的世界观,去研究鲨鱼、蜗牛和牛蛙,去思考细胞、神经元、大脑等问题。

之后,到了1986年,他和杰夫里·辛顿(图灵奖获得者之一)一起开发出了玻尔兹曼机,把神经网络带入到研究与应用的热潮,将“深度学习”变成了核心技术。但是“深度学习”饱受争议,2017年,一位得奖的谷歌科学家仍然说深度学习缺乏严谨性,是“炼金术”。

这种说法不无道理,深度学习在基础理论上仍然处于摸索阶段,没有一个清晰明快的数学结构来揭秘它。人们把各种数据丢进去,应用到各种场景,尝试各种算法,然后看看会出来什么结果,确实有点像“炼金术”,此时5+2真的不一定等于7。

国内一群程序员在讨论ChatGPT的时候也说,这就是个大黑箱,扔进去一句话,根本不知道出来的是什么。

特伦斯告诉记者:“在人工智能研究领域有两个方向,两个方向同等重要。当人类感到饥饿的时候,他会去探索,他在A地发现了苹果,这很好;但是可能在B地会发现鱼,这更好,这时需要选择,是留下来吃苹果,还是去寻找可能的鱼?如果以数据为线索,就相当于利用已有的优势资源,这是一件好事;但如果不去探索更多的领域,就可能落伍,错过B地的更好资源。所以,不仅要开发现有的资源,还需要优秀的研究人员去探索算法。”

记者又问:“关于人工智能,美国科技界是否在多个方向上布局?”

特伦斯答:“是的,因为我们不知道哪个方向是对的,所以在多个方向上探索。美国的特点是从下至上,很多企业家、公司和机构在不同的领域下注。”

那次,特伦斯讲了一个故事:有公司提供这样的服务,如果皮肤病患者将患处拍照发到他们平台,他们的AI系统就可以帮助判断是否良性。有一个女子,看到男朋友背上长了一些东西,就随手拍了照片发过去,没想到就是恶性的。因为及时就诊,这女子救了男朋友一命,公司收费才29美元。

AI可以下棋、画画、写文章,还可以救人一命,AI如此强大又如此可爱,即便它有时候胡说八道,我们也必须拥抱AI。

(长江日报记者李煦)

【编辑:张靖】

更多精彩内容,请在各大应用市场下载“大武汉”客户端。

阅读剩余
THE END