本文目录一览:

谁一直在研究如何使用人工智能打王者荣耀?

如果让人工智能来打王者荣耀,应该选择什么样的英雄?近日,匹茨堡大学和腾讯 AI Lab 提交的论文给了我们答案:狄仁杰。在该研究中,人们尝试了 AlphaGo Zero 中出现的蒙特卡洛树搜索(MCTS)等技术,并取得了不错的效果。

对于研究者而言,游戏是完美的 AI 训练环境,教会人工智能打各种电子游戏一直是很多人努力的目标。在开发 AlphaGo 并在围棋上战胜人类顶尖选手之后,DeepMind 正与暴雪合作开展星际争霸 2 的人工智能研究。去年 8 月,OpenAI 的人工智能也曾在 Dota 2 上用人工智能打败了职业玩家。那么手机上流行的多人在线战术竞技游戏(MOBA 游戏)《王者荣耀》呢?腾讯 AI Lab 自去年起一直在向外界透露正在进行这样的研究。最近,匹茨堡大学、腾讯 AI Lab 等机构提交到 ICML 2018 大会的一篇论文揭开了王者荣耀 AI 研究的面纱。

本文中,我们将通过论文简要介绍该研究背后的技术,以及人工智能在王者荣耀中目前的能力。

2006 年 Remi Coulom 首次介绍了蒙特卡洛树搜索(MCTS),2012 年 Browne 等人在论文中对其进行了详细介绍。近年来 MCTS 因其在游戏 AI 领域的成功引起了广泛关注,在 AlphaGo 出现时关注度到达顶峰(Silver et al., 2016)。假设给出初始状态(或决策树的根节点),那么 MCTS 致力于迭代地构建与给定马尔可夫决策过程(MDP)相关的决策树,以便注意力被集中在状态空间的「重要」区域。MCTS 背后的概念是如果给出大概的状态或动作值估计,则只需要在具备高估计值的状态和动作方向扩展决策树。为此,MCTS 在树到达一定深度时,利用子节点鉴别器(策略函数(Chaslot et al., 2006)rollout、价值函数评估(Campbell et al., 2002; Enzenberger, 2004),或二者的混合(Silver et al., 2016))的指引,生成对下游值的估计。然后将来自子节点的信息反向传播回树。

MCTS 的性能严重依赖策略/值逼近结果的质量(Gelly Silver, 2007),同时

开放api是开源吗

开放API并不等同于开源。开放API是指一个软件或平台允许第三方开发者使用其接口和数据,以便创建新的应用程序或服务。开源则是指软件的源代码是公开的,任何人都可以查看、修改和分发。虽然开放API和开源都可以促进创新和合作,但它们是不同的概念。

开放API的优点是可以让不同的应用程序之间实现互操作性,从而提高整个生态系统的价值。例如,许多社交媒体平台都提供开放API,使得第三方开发者可以创建各种应用程序,如社交媒体管理工具、数据分析工具等。这些应用程序可以帮助用户更好地管理和分析他们的社交媒体账户,从而提高效率和效果。

总之,开放API和开源是两个不同的概念,但它们都可以促进创新和合作。开放API可以让不同的应用程序之间实现互操作性,从而提高整个生态系统的价值。而开源则可以让开发者更容易地查看、修改和分发软件的源代码,从而促进创新和合作。

程序员的饭碗不保?国外推出自动生成代码的AI工具

近日,GitHub 和 OpenAI 发布了一款名为 Copilot 的AI工具的预览版,该工具可用于 Visual Studio Code 编辑器中自动生成代码片段。

根据 GitHub 的说法,Copilot 所做的不仅仅是模仿以前见过的代码。它具备更加强大的功能,会先分析程序员已经编写的代码再生成新的匹配代码,包括之前调用的特定函数。该项目的 示例包含自动编写导入推文的代码,绘制散点图等都已经展示在 GitHub 网站上。

根据GitHub的CEO Nat Friedman 透露,该工具适用于Python、JavaScript、TypeScript、Ruby和GO等编程语言。

Copilot 建立在一种名为 OpenAI Codex 的新算法之上,OpenAI 首席技术官 Greg Brockman 将其称 为 GPT-3 的后代。

GitHub 将它当作是多人合作编程的演变,其中两个程序员同时在一个项目上,以发现彼此的错误并加快开发过程。使用 Copilot 时,其中的一个程序员就是虚拟的。

在我看来,这项技术有利于减少人力成本,并且提高工作效率。毕竟对于程序员来说,人与机器的沟通效率高于人与人的沟通效率。

目前, Copilot 还处于受限的技术预览阶段,但是大家可以从 GitHub 网站上获取到,并抢先体验。

大家觉得这项技术会获得成功,并广泛应用于各大公司吗?

告别面向Google编程,Copilot测试版本体验

最近OpenAI和GitHub联合发布了一个名为Copilot代码生成工具。这个工具基于GPT-3自然语言处理模型开发,并使用GitHub上的数十亿行代码作为训练数据,实现在写代码时自动提供代码建议的功能。

目前该产品已经在Vscode extenison中上线。作为长期面向Google编程的小白,当然是偷懒等不了明天,早早在官网排队等待试用名额,幸运地在一两周前获得了试用机会。

一周的体验下来,我认为Copilot的功能相较于其他代码补齐工具而言更加强大,更加灵活,甚至有时让我有种仿佛Copilot真的能读懂我的想法和代码,并且将其实现的感觉。显著提高了写码效率。

大家对GPT-3并不陌生 - 或许是2020年最火的自然语言处理模型,训练成本接近500万元,模型参数超过1750亿个。他是一个自回归模型,通俗理解就是输入一段文本的前一部分,预测接下来的文本的概率分布。GTP-3 自问世以来就被开发成几十个大大小小的不同应用,例如进行一些创作性写作(诗歌,小说等),编写前端代码(debuild.co)等等。

鲁迅曾经说过,XXX是最好的语言,既然GTP-3在语言方面如此有天赋,那么在写代码方面应该也会有所建树吧。果然CodeX - 基于GTP-3微调后的编程语言版本也在不久后问世,而Copilot正是CodeX的第一个商业化应用。

Copilot官网中列举了Copilot的四个使用方向:

可以说,如果真的能实现上述所说的四点,那么真的是可以极大地提高代码编写效率,在拿到试用资格后,我就如上几点进行了体验和测试,究竟能不能达到官网上所说的神奇效果呢?

首先我创建了一个新的项目,正巧当时打算瞄一眼比特币的价格,对了,要不让Copilot帮我写一个吧!我在注释中定义了想要的函数,看看Copilot能不能读懂我的意思呢?

openai体验(openio)

第一次运行的时候我实实在在地被“惊吓”到了,Copilot似乎是理解了我的注释,刚开始定义函数,Copilot就迫不及待给我推荐了传入的参数,紧接着又推荐了完整的函数代码。虽然之前也存在类似语言转代码生成工具,但是使用的丝滑程度和生成代码的准确度上,个人感觉Copilot都遥遥领先于其他工具。

更多时候,我们需要在已有代码上进行添加或者修改,其中不乏需要写一些功能,格式较为相似的函数。有时我会选择直接复制粘贴函数然后进行修改,但是一旦需要修改的变量较多,往往会遗漏导致测试时报错。那么在类似场景下,Copilot是否能给我们提供一个更合适的“参考答案”呢?

我用以下代码进行了一个简单测试,在DeepaiImageApi模块中,我想要通过两个不同函数分别实现将图片数据和图片url传给DeepAI提供的API接口。在我定义了第一个函数方法之后,来看看Copilot是否能根据我的注释直接生成我想要的代码吧:

结果是非常Amazing啊,可以看出Copilot不仅提供了符合范式的函数名,代码以及符合项目代码的参数调用,并且对函数内容也有相对应的改动(request.post中传入的files参数由image变成了url)。说明copilot的确将本地文件中的代码作为了模型的输入值,并且很好地“理解”了代码中的重要特征,如格式,规范,结构等等。

总体而言,虽然Copilot生成的代码在多数情况下还需要检查和调整,但是他革命性的代码生成效果还是把初步接触Copilot的我惊艳到了,有时就算程序已经写好,我还是会特意按下Ctrl+Enter查看copilot提供的不同思路和方法。

最后夹带一点点个人观点,有人质疑Copilot成熟以后或许会抢走部分程序员的饭碗,或者让程序员自主思考的能力逐渐退化,作为一个入门码农来说我目前觉得并不需要担心。Copilot给我的感觉像是一个专门提供给程序员的Google,或是一套整理齐全,索引完备的代码答案库,在面对多数人遇到过的类似问题的时候,可以提高编程效率,减少面向Google编程时搜索合适答案的时间。

而另一方面,GTP-3本质上是一个自回归模型,我们无法依赖其提供给我们更加创新的算法或代码方案,当大多数程序员从重复且枯燥的代码中解放出来的时候,或许会就有更多的人类智慧被利用在创新性的工作中,从而加速行业的进步。

人工智能研究公司OpenAI上周正式推出Chat

1;随着越来越多的人加入 ChatGPT,也会使它多的能力越来越完善,这就是AI的特点,就目前 ChatGPT 的表现来看,已经可以替代大部分简单的CRUD,随着它的完善,对程序员的工作我相信是有一定的冲击的,最直接的就是导致大量底层程序员的失业。

言归正传,我直到最近才有时间体验ChatGPT,体验之后感觉现阶段的ChatGPT已经有以下几个比普通人强的点。

2;人工智能研究公司 OpenAI 上周正式推出 ChatGPT,这是一种基于对话的人工智能聊天机器人模型,它能够理解自然语言并以自然语言的方式做出回应。ChatGPT 基于 GPT-3.5 模型微调而成,以语言服务模型 InstructGPT 为基础,通过人类回馈增强学习训练模型 RLHF,不过数据设置略有不同。它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求,能以更贴近一般人的对话方式与使用者互动。