时间:2022-10-10 19:16:44 | 浏览:2382
选自IEEE
作者Craig S. Smith
机器之心编译
编辑:杜伟
当 AI 代码生成工具越来越深入地参与到编程工作中,一些人担心长此以往它会不会取代人类程序员呢?IEEE 的一篇文章探讨了这类 AI 辅助工具的发展历程、对程序员的影响以及未来走向。
程序员注定要被取代吗?自从 OpenAI 的大规模语言模型 GPT-3 展示其基于简单的书面指令创建 HTML 网站这一惊艳的能力以来,计算机编程社区便一直被该问题笼罩着。
自那之后的几个月里,更是出现了可以根据自然语言描述(口头或书面人类语言)编写简单但完整的计算机程序以及加快程序员工作进程的自动编程助手。AI 会在多大程度上取代或增强程序员的工作呢?
IEEE Spectrum 就此咨询了一些专家,得到的坏消息是编程或许注定要被取代。但也有好消息,即在可预见的未来,计算机编程和软件开发似乎仍将是一项人类参与度极高的工作。与此同时,AI 赋能的自动代码生成通过允许在更短时间里编写更多代码,从而越来越加速软件开发。
亚马逊 AI 服务副总裁 Vasi Philomin 表示,「我不相信 AI 会完全取代人类开发者。AI 工具可以将程序员从日常任务中解放出来,但计算机编程的创造性工作仍将继续存在。」
如果有人想要成为一名开发者,但 10 年后,他们并不一定需要学习一种编程语言。相反,他们需要理解创建计算机程序的语义、概念和逻辑序列,这会将软件开发开放给更广泛的人群。
计算机编程的智能化、自动化程度越来越高
当 1940 年代电子计算机编程开始时,程序员使用数字机器码编写。直到 1950 年代中叶,美国杰出女性计算机科学家 Grace Hopper 及其 Remington Rand 公司的团队开发了 FLOW-MATIC,它允许程序员使用有限的英语词汇来编写程序。
从那时起,编程语言越来越高效,程序员的工作也更加高效。
AI 编写的代码成为更广泛改变的最前沿,它允许人们完全不用编码也能编写软件。现在已经有了像 Akkio 这样的无代码 AI 开发平台,人们可以通过简单的拖放和单击按钮功能构建机器学习模型。微软的 Power Platform 平台包括了一系列低代码产品,用户只需描述就可以生成简单的应用程序。
今年 6 月,亚马逊推出了 CodeWhisperer 预览版,这是一个基于机器学习的编程助手,类似于 GitHub 的 Copilot。这两个工具都是基于大型语言模型(LLMs),这些模型已经在海量代码库中进行了训练。当程序员编写代码时,CodeWhisperer 和 Copilot 都会提供自动补全建议,并根据简单的自然语言短语给出可执行指令建议。
前几天,GitHub 对 2000 名开发者展开了一项调研,结果发现,Copilot 将一些编码任务的时间缩短了一半,并提升了开发者对自身工作的整体满意度。
超越代码自动补全并不容易
但如果想要超越自动补全,则问题在于将意图(intent)教授给计算机。软件需求通常是模糊的,自然语言的不准确也众所周知。
英国人工智能初创公司 Diffblue 致力于使用 AI 检查和纠正代码,其联合创始人之一 Peter Schrammel 对此表示,想要解决英文书写规范中存在的歧义,则需要进行一些增量改进,在人与机器之间展开一些对话。
为了解决这些问题,微软的研究人员最近提出像基于 LLM 的代码生成中添加一种反馈机制,以便计算机在生成代码之前要求程序员澄清任何歧义的地方。微软的这一交互式系统名为 TiCoder,通过生成所谓的「测试驱动用户意图形式化」(TDUIF)来细化和形式化用户意图。
TDUIF 试图使用迭代反馈来判断程序员的算法意图,然后生成与程序员所表达意图一致的代码。下图为 TDUIF 的工作流。
论文地址:
https://arxiv.org/abs/2208.05950
根据相关论文,当在 Mostly Basic Programming Problems(MBPP)基准上评估时,TiCoder 将自动生成代码的准确率从 48% 提升到了 85%。MBPP 旨在评估机器生成的代码,它包含大约 1000 个众包 Python 编程问题,由入门级程序员来解决。
一个代码单元可以长达几百行,它是程序中可以独立维护和执行的最小部分。一套单元测试通常由数十个单元测试组成,每个单元测试包含 10 到 20 行代码,用来检查单元是否按预期执行,以便当你将单元堆叠一起时,程序按预期工作。
单元测试对于调试单个函数以及手动更改代码时检测错误非常有用。此外,一个单元测试还可以用作代码单元的规范,并用来指导程序员编写干净、无 bug 的代码。虽然并没有很多的程序员追求真正的测试驱动开发,其中首先要编写单元测试,但单元测试与单元往往一起编写。
专家认为:人类程序员不会因 AI 代码生成失去工作
根据 2019 Diffblue 开发者调研的结果,开发者将大约 35% 的时间用来编写质量控制测试,而不是编写用于生产用途的代码,因此实现这部分工作的自动化就可以显著地提高生产力。
同时,Copilot、CodeWhisperer 以及其他 AI 编程助手包都可以用作编写单元测试的交互式自动补全工具。程序员得到编码建议,并选择其中效果最好的。
今年 2 月份,DeepMind 进一步使用 AlphaCode 进行完全自动代码生产。AlphaCode 是一种大型语言模型,可以根据自然语言指令编写简单的计算机程序。它使用编码器 - 解码器 Transformer 架构,首先对问题的自然语言描述进行编码,然后将生成的向量解码成解决方案所需的代码。
AlphaCode 概览。图源:
https://arxiv.org/pdf/2203.07814.pdf
该模型首先在 GitHub 代码库上进行训练,直至它能够生成看起来合理的代码。同时为了对该模型进行微调,DeepMind 使用了 15000 对自然语言问题描述和以往编程竞赛中成功的代码解决方案,来创建一个关于输入 - 输出示例的专用数据集。
一旦 AlphaCode 经过了训练和微调,它就能针对其以往未见过的问题进行测试。最后一步是生成大量解决方案,然后使用过滤算法选出最佳的。DeepMind 深度学习团队负责人 Oriol Vinyals 认为,他们通过对该语言模型进行了近 100 万次的采样,创造了很多不同的程序。
为了优化样本选择过程,DeepMind 使用一种聚类算法将解决方案分组。聚类过程倾向于将可运行的解决方案组合在一起,使得更容易找到一小部分可能像程序员编写的一样工作的候选方案。
为了对系统进行测试,DeepMind 在流行的 Codeforces 平台上向人类编程竞赛提交了 10 个 AlphaCode 编写的程序,其中解决方案排在前 54%。
在最近的一次采访中,Oriol Vinyals 反问道,「为了生成一个程序,你是不是只要用自然语言编写它而不需要编码,然后解决方案就会在另一端出现呢?」Vinyals 与其他人对此持审慎态度,认为实现这一目标需要时间,可能是数十年。
Landing AI 创始人兼 CEO、AI 知名学者吴恩达表示,我们距离一个人能够告诉计算机编写任意复杂的计算机程序的要求并自动完成编码,仍然很遥远。
但是,考虑到 AI 代码生成在短短几年取得进展的速度,AI 系统最终能够根据自然语言指令编写代码似乎是不可避免的演化趋势。而手动编程软件程序将越来越像手工编织毛衣。
为了给计算机提供自然语言指令,开发者仍然需要了解一些逻辑和功能的概念以及如何构造事物。即使开发者不学习特定的编程语言或者编写计算机代码,但仍需要学习基础编程。反过来,这将使得更多的程序员创建越来越多样化的软件。
Vasi Philomin 表示自己不相信 AI 会取代人类开发者。AI 可以消除开发者不得不做的琐碎的、程式化的工作,使他们专注于更高价值的事情。
Peter Schrammel 也同意 AI 自动代码生成允许软件开发者能够专注于更困难和更具挑战性的任务。不过他补充道,至少需要确认机器所理解的内容是不是人类的意图。
他还表示,软件开发者不会因自动化代码工具取代他们而失去工作,总有更多的软件需要编写。
原文链接:
https://spectrum.ieee.org/ai-code-generation-language-models
选自IEEE作者Craig S. Smith机器之心编译编辑:杜伟当 AI 代码生成工具越来越深入地参与到编程工作中,一些人担心长此以往它会不会取代人类程序员呢?IEEE 的一篇文章探讨了这类 AI 辅助工具的发展历程、对程序员的影响以及未
图片来源@视觉中国文 | 后厂青年,作者|魏婕1024,二进制的程序世界和十进制的现实世界之间的接口。于是每年的10月24日,就成为了国内的程序员节。后厂青年联合社交平台脉脉,特别推出程序员观察报告,从程序员女朋友的视角出发,了解他们的可爱
在很多人眼里,程序员是一类高薪、“高危” 的职业。 他们穿着格子衫、顶着一碗超帅的光头,能修电脑、能黑网站、简直无所不能。 。 。但直到我自己当上程序员,才发现其实很多人都是对程序员的误解。除了外行的误解外,还有很多来自于程序员同行的误解。
多少次熬夜加班, 直至见到凌晨四点的太阳;多少个早晨洗漱的时候, 看到洗脸盆掉的全是头发;整天coding, debugging, 设计, 画图, 文档, 会议, 演示......看似充实饱和的工作, 又夹杂了多少苦涩与无奈; 程序员其实很
同样都是敲代码,为什么别人一个月工资五万,你一个月却只拿五千?是单纯在找工作的时候运气不佳?还是因为技术水平有差别?那些被大众膜拜信仰的技术大神到底牛在哪里,现状已定,普通程序员是否还有机会逆袭?看完这篇文章,或许你能从中找到答案。从思维和
首先,当前程序员职业确实存在职业生命周期偏短的问题,原因是多方面的,包括工作量大、工作周期长、技术迭代速度快、岗位竞争压力大等因素,但是当前不少技术团队中,也有很多70后、80后的程序员,而且随着人工智能等技术的发展,以及IT互联网行业产业
中国码农千千万,北上深杭一大半。虽然所有的程序员都有着相似的气质,几乎每个人衣橱里都有差不多款式的牛仔裤、旅游鞋、格子衬衫,无论男女都有至少一个双肩包,但一方水土养一方人,每个地方的程序员都可以从茫茫人海中找到"老乡"。比如,北京的程序员大
进入一个行业,开始一份工作,不论在最初的时候,你是因为喜欢还是被动接受,或多或少的都会成为你一段时间内为之奋斗的事业。边工作边迷茫也许是大多数人的常态,觉得这份工作不适合自己,可又不知道应该去做什么;喜欢着自己的工作,却又不知道怎么进一步提
整理 | 刘静出品 | CSDN(ID:CSDNnews)学位高就能够拿高薪?我们的薪资与全球其他国家或地区的同行相比中间有多大的差距?Hired 近日发布的 《2019 年度薪酬状况报告》 解答了技术者们的诸多疑问。该报告聚焦于全球 13
程序员是21世纪比较吃香的工作。程序员工资高还不需要和复杂的社会打交道。那么怎么成为一名程序员?当程序员需要学什么?怎么成为一名程序员?【有明确的职场定位】怎么成为一名程序员?程序员也分为很多种,使用的软件和工作范围也不同。想当程序员,就要
在职场中,我们应该追寻一种平等关系,也就是说公司看中求职者的能力,求职者希望公司给予自己满意的薪资和发展空间。因此,面试是选择和被选择的关系,拒绝和接受都是很正常的事情,而非一方的强人所难或是“王婆卖瓜”行为。近日,一名程序员在求职过程中由
从业一开始,加班就是常态很多人都说这个程序员的工资比较高,其实这种背后的心酸,其实很少人知道。就拿我来说吧其实我工作了有七八年,记得刚工作那个时候,天天加班的话,就是白天睡觉,晚上加班,当时其实也没什么经验,就是只是凑人数嘛。当时我们项目经
在目前互联网行业,计算机领域都离不开编程,程序员也受市场的大量需求,而且目前程序员的薪酬普遍很可观,在北上广深等一线城市,程序员的薪酬基本都是上万,两三万一月的都有的是,甚至很多都直接讲年薪,程序员在目前还是比较吃香的职的业。那么我们学怎样
程序有问题时不要担心。如果所有东西都没问题,你就失业了在我的编程生涯中,我碰到过很多奇奇怪怪的对手和同盟。我把这些编码战士们分成五类,有些人是你队伍中的好伙伴,有些人则是捣蛋者,让你的每一个计划都完不成。不管怎么说,他们在软件开发的诸神殿上
不是每一个写代码的都是程序员。这里,我把程序员定义为以编程为生的人。我认为世界上存在四类程序员:科学家、码农、专家和工匠。下面我一一介绍自己的观点。科学家,与其说他们是程序员,不如说他们是数学家。他们发明了各种理论、算法和术语,教科书上那深