本文目录一览:

ai运动产品生产模式有哪些

AIGC 即 AI Generated Content,利用人工智能技术来生成内容,它被认为是继PGC、UGC之后的新型内容创作方式。2022年AIGC高速发展,这其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为AIGC发展的“加速度”。

2、AIGC有哪些应用价值?

AIGC将有望成为数字内容创新发展的新引擎。1)AIGC能够以优于人类的制造能力和知识水平承担信息挖掘、素材调用、复刻编辑等基础性机械劳动,从技术层面实现以低边际成本、高效率的方式满足海量个性化需求。2)AIGC能够通过支持数字内容与其他产业的多维互动、融合渗透从而孕育新业态新模式。3)助力“元宇宙”发展。通过AIGC加速复刻物理世界、进行无限内容创作,从而实现自发有机生长。

1)AIGC+传媒:写稿机器人、采访助手、视频字幕生成、语音播报、视频锦集、人工智能合成主播

2)AIGC+电商:商品3D模型、虚拟主播、虚拟货场

3)AIGC+影视:AI剧本创作、AI合成人脸和声音、AI创作角色和场景、AI自动生成影视预告片

4)AIGC+娱乐:AI换脸应用(如FaceAPP、ZAO)、AI作曲(如初音未来虚拟歌姬)、AI合成音视频动画

5)AIGC+教育:AI合成虚拟教师、AI根据课本制作历史人物形象、AI将2D课本转换为3D

6)AIGC+金融:通过AIGC实现金融资讯、产品介绍视频内容的自动化生产,通过AIGC塑造虚拟数字人客服

7)AIGC+医疗;AIGC为失声者合成语言音频、为残疾人合成肢体投影、为心理疾病患者合成医护陪伴

8)AIGC+工业:通过AIGC完成工程设计中重复的低层次任务,通过AIGC生成衍生设计,为工程师提供灵感

3、AIGC商业模式如何?

1)作为底层平台接入其他产品对外开放,按照数据请求量和实际计算量计算:GPT-3对外提供API接口,采用的四种模型分别采用不同的按量收费方式

2)按产出内容量收费:包括DALL·E、Deep Dream Generator等AI图像生成平台大多按照图像张数收费

3)直接对外提供软件:例如个性化营销文本写作工具AX Semantics则以约1900人民币/月的价格对外出售,并以约4800欧元/月的价格提供支持定制的电子商务版本。大部分C端AGC工具则以约80人民币/月的价格对外出售

4)模型训练费用:适用于NPC训练等个性化定制需求较强的领域

5)根据具体属性收费:例如版权授予(支持短期使用权、长期使用权、排他性使用权和所有权多种合作模式,拥有设计图案的版权)、是否支持商业用途(个人用途、企业使用、品牌使用等)、透明框架和分辨率等

4、AIGC的行业门槛及壁垒是什么?

1)打造一体化解决方案服务能力:AIGC本质上提供的是内容的生成工具,和传统的内容辅助编辑逻辑是相同的。采集、生产、媒资管理、分发消费等视频整个生命周期,一般都需要覆盖内容生成的全生命周期。

2)与行业的深度绑定关系:通过和行业形成深度绑定关系,接入相关平台或底层系统的,与原来的内容载体建立良好的合作关系,除去说明场景可行性外,还需要强调对方在基础架构上的配合意愿。

3)构建业务闭环:创作型的工具如何得到反馈的手段,需要新的模式形成闭环。需要从“拼接式”(需要大量的人工标注数据,只能针对具体任务,不会自我成长)到“进化式”(创造特定条件和核心能力,使之能够完成通用任务并自我成长),并与用户增加对话轮次、建立情感链接。

5、AIGC技术处于什么发展阶段?

2021年之前,AIGC生成的主要是文字,而新一代模型可以处理的格式内容包括:文字、语音、代码、图像、视频、机器人动作等等。AIGC被认为是继专业生产内容(PGC,professional-generated content)、用户生产内容(UGC,User-generated content)之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势。

2022年:AIGC高速发展,其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为AIGC发展的“加速度”。

6、AIGC的发展面临什么挑战?

AIGC在引发全球关注的同时,知识产权、技术伦理将面临诸多挑战和风险。同时AIGC距离通用人工智能还有较大的差距。

1)知识产权争议。AIGC的飞速发展和商业化应用,除了对创作者造成冲击外,也对大量依靠版权为主要营收的企业带来冲击。

2)关键技术难点。AIGC距离通用人工智能还有较大差距,当前热门的AIGC系统虽然能够快速生成图像,但是这些系统未必能够真正理解绘画的含义,从而能够根据这些含义进行推理并决策。

3)创作伦理问题。部分开源的AIGC项目对生成的图像监管程度较低,数据集系统利用私人用户照片进行AI训练,侵权人像图片进行训练的现象屡禁不止。一些用户利用AIGC生成虚假名人照片等违禁图片,甚至会制作出暴力和性有关的画作。由于AI本身尚不具备价值判断能力,一些平台已经开始进行伦理方面的限制和干预,但相关法律法规仍处于真空阶段。

7、如何看待AIGC的未来趋势?

据李彦宏判断,未来AIGC将走过三个发展阶段:助手阶段、协作阶段、原创阶段。

在第一阶段,AIGC将辅助人类进行内容生产;

第二阶段,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;

第三阶段则是原创阶段,AIGC将独立完成内容创作。Gartner预计,到2025年,生成式人工智能将占所有生成数据的10%。

推动这一变化发生的驱动力在于:

1)核心技术升级不断发展。AIGC的三大基础能力包括内容孪生、内容编辑、内容创作,将随着产业发展而逐渐升级。

2)产品类型逐渐丰富。人工智能的不断发展及推进,也将使AIGC模态不再仅仅局限于文本、音频、视觉三种基本形态。嗅觉、触觉、味觉、情感等多重信息感知和认知能力将以数字化的形式传输并指导人工智能进行内容创作,甚至创造出酸甜苦辣外的另一种味道。

3)场景应用趋于多元。目前,AIGC已经在多个领域得到广泛应用,如金融、传媒、文娱、电商等,未来应用场景会进一步多元化。除应用场景的横向扩展外,场景与场景的融合交互也是未来的发展趋势之一。

4)生态建设日益完善。技术研发的不断创新将强有力地推动内容创作,提高生成内容质量,使内容更接近人类智力水平和审美标准,同时应用于各类行业各种场景。AIGC的繁荣发展将促进资产服务快速跟进,通过对生成内容的合规评估、资产管理、产权保护、交易服务等构成AIGC的完整生态链,并进行价值重塑,充分释放其商业潜力。

8、AIGC未来市场空间有多大?

随着标注数据累积、技术架构完善、内容行业对丰富度/事实性/个性化的要求越来越高,AIGC行业即将被推向前台。

在未来2-3年间,AIGC的初创公司和商业落地案例将持续增加。目前由人工智能生成的数据占所有数据的1%不到,根据Gartner预测,到2025年,人工智能生成数据占比将达到10%。根据《Generative AI:A Creative New World》的分析,AIGC有潜力产生数万亿美元的经济价值。

9、AIGC的产业链分布如何?

我国的AIGC行业尚未发展成型,目前,AIGC代表公司较少,且上游还有众多欠缺。

国内的AIGC场景开发较少:在我国,由于技术发展不足以及投资环境的影响,AIGC大多被作为公司的部分业务、乃至相对边缘化的功能进行研发开发,独立运行的初创公司数量明显少于国外,大部分细分赛道的初创玩家在5家以下,这也间接导致了国内的AIGC场景开发较少。

AIGC应用场景深度不足:国内布局最多的赛道是写作和语音合成领域,虚拟人赛道刚刚开始兴起基本均停留在内容领域。而在国外延展领域得到了更为充分的挖掘,例如个性化文本生成、合成数据等赛道均是重点布局领域。此类业务拓展的综合性要求较高,需要客户方的数字化程度以及对对应行业的充分了解。

10、AIGC相关公司有哪些?

上市公司

300418 昆仑万维

业务布局:公司在AIGC领域已经投入了近两年的时间,国内最早布局AIGC领域的公司之一。公司成立了MusicX Lab,致力于打造领先的人工智能音乐生成技术,目前已正式销售AI作曲,具备成熟专业的全链路音乐制作和全球音乐发行能力。22Q3 MusicXLab再推10首新作AI歌曲,算法模型及AIGC能力不断优化提升。目前新歌已在国内外各大平台上线。

客户类型:22Q3在国内外各大平台再推新歌的基础上,也积极拓展了车企、教育、时尚、游戏、娱乐等各个行业的合作生态,达成了歌曲代销、车机音源、公播音乐、AI音乐辅学、品牌联名主题曲、有声书及视频配乐等落地业务。例如,MusicXLab与音乐公司达成歌曲代销合作,与头部车企达成AIGC战略合作,与游戏公司签约BGM长期合作,与教育机构达成AI音乐评价辅学合作等。先进科技的持续赋能和产品矩阵的不断丰富将为StarX发展注入强劲动力。

301270 汉仪股份

公司以技术驱动设计,近年来针对字库产品设计、生产、传输、储存到识别的全业务链条进行持续不断的研发投入,实现了全面的技术储备以保证公司业务持续高效的发展。同时,公司紧随信息技术、人工智能的发展步伐,及时将先进的信息技术应用于字库行业,形成了以大数据、人工智能为基础的技术储备。

300364 中文在线

公司已推出AI绘画功能和AI文字辅助创作功能,其中AI文字辅助创作功能已上线,该功能已向公司旗下17K文学平台全部作者开放。公司深度结合作者的真实写作场景,作者在使用AIGC功能时,通过针对不同的描写场景填写关键词和辅助短语,即可生成对应的文字内容描写,提高写作效率。目前可针对人物、物品等进行AI辅助创作,并针对不同的作品类别如古风、都市等进行语言调整,带来最佳的内容产出体验,大幅提升创作效率和内容的可读性。

000681 视觉中国

公司在AI方面持续投入,已发售数轮AI数字藏品,并使用AIGC方式创作图片内容,目前平台仍在大力投入AI布局。

300624 万兴科技

公司已布局虚拟数字人、虚拟场景、虚拟直播等创新业务领域;近日在2022全球元宇宙大会论坛上宣布布局AIGC赛道,公司旗下首款AI绘画软件“万兴AI绘画”正式开启公测。

300229 拓尔思

公司已落地了一批服务型虚拟人项目,其中与广东省共建“南方乡村振兴新农人AI数智赋能平台”,定位于农产品直播内容智能创作的AIGC在线服务平台,主要面向农产品电商主播提供直播脚本智能创作、带货虚拟人全链租用等知识赋能服务。

2022年世界杯举办期间,公司将利用自研互联网大数据资讯平台,对世界杯相关的热点和话题进行大数据分析和研判,通过AIGC的内容自动创作和虚拟数字人进行联合,开展“大数据看世界杯”的虚拟数字人系列服务。

002657中科金财

今年服贸会期间,公司发布了中科金财“元宇宙技术服务矩阵”,其中,公司基于WEB3.0规则架构,研发了数字人内容制作引擎、元宇宙场景开发工具,并通过AIGC的企业级内容互动创作平台,实现与中科金财元宇宙数字化营销平台“觅际”融合,公司作为邮储银行北京分行在服贸会上的合作伙伴,通过上述技术服务,首次实现了“沉浸式购物+数字人民币”场景落地。

BIDU 百度

在9月23日举办的2022万象·百度移动生态大会上,百度发布了AI助理,覆盖了各种AIGC应用,包括AI自动生成文字、图片以及图片转换成视频。借助AIGC的力量,百度希望为现有的500多万百家号创作者带来一套AI生产内容工具,帮助他们更快更好地产出视频内容,从而增加百度百家号等产品的用户粘性,以反击头部短视频平台。目前百度已经和数十家权威媒体成立“AIGC媒体联盟”。

300130 新国都

公司全资子公司新国都智能基于图像深度学习、计算机视觉等前沿AI技术,积极探索AI人工智能技术在AIGC、智能驾驶等领域的应用。

0700 腾讯

腾讯AI Lab基于自己的多模态学习及生成能力在游戏领域进行了全流程的布局。「绝悟」AI通过强化学习的方法来模仿真实玩家,包括发育、运营、协作等指标类别,以及每分钟手速、技能释放频率、命中率、击杀数等具体参数,让AI更接近正式服玩家真实表现,将测试的总体准确性提升到95%。目前腾讯绝悟在环境观测、图像信息处理、探索效率等方面的创新算法已经突破了可用英雄限制(英雄池数量从40增为100 ),让 AI 完全掌握 所有英雄的所有技能并达到职业电竞水平,能应对高达10的15次方的英雄组合数变化。目前,腾讯AI Lab还与腾讯 AI Lab 还与王者荣耀联合推出了AI开放研究平台「开悟」,并积极举办相关赛事。

MFST 微软

微软亚洲研究院支持图像变为动态、文本生成视频、文本生成图像、图像补全、图像生成的NUWA-Infinity

BABA 阿里巴巴

阿里巴巴智能设计实验室研发虚拟模特塔玑及AI视觉物料生成系统阿里鹿班。

NVDA 英伟达

在视觉生成研究领域始终位于前沿,代表作品包括CycleGAN、GauGAN、EditGAN、GANverse3D、Instant NeRF等。

未上市公司

小冰公司

成立时间及融资轮次:2020年 A轮(估值已达10亿美元独角兽,高瓴领投)

AIGC相关亮点:作为“AI being”派虚拟人。小冰的产品虚拟人、音频生成、视觉创造、文本创造、虚拟社交、Game AI等。

客户范围:客户已覆盖金融、智能车机、零售、体育、纺织、地产、文旅等十多个垂直领域,并提出了以“人力”的逻辑去进行商业报价的虚拟人商业模式。

DeepMusic(灵动音科技)

成立时间及融资轮次:2018年 A轮(TME领投,单轮融资数千万人民币)

AIGC相关亮点:产品包括针对视频生成配乐的配乐猫、支持非音乐专业人员创作的口袋音乐、可AI生成歌词的 LYRICA、AI作曲软件LAZYCOMPOSER。目前已与国内多家音乐平台厂商达成合作。其音乐标注团队已形成了全球最精确的话语歌曲音乐信息库。

倒映有声

成立时间及融资轮次:2019年 Pre-A轮(中文在线投资,单轮融资千万人民币级)

AIGC相关亮点:倒映有声通过神经渲染技术快速构建AI数字分身,通过语音+图像生成技术,生成和驱动数字分身的唇形、表情、动作、肢体姿态,创造表情自然、动作流畅、语音充满情感的高拟真度数字分身IP。2021年3月倒映有声和中央广播电视总台音频客户端「云听」签署战略合作协议。

rct AI

成立时间及融资轮次:2018年 A3轮(元宇宙资本和Springwind Ventures领投,单轮融资额超千万美元)

AIGC相关亮点:通过简单设计并调整不同的参数,rct AI的混沌球(Chaos Box)算法可以在游戏中大规模地轻松生成具有智能意识的虚拟角色。他们的行为和对话不会重复,皆为动态生成。目前,rct AI已凭借核心技术Chaos Box帮助了10余家企业,完成包括对战游戏、虚拟人铸造等多种类型的项目,与世界范围内 20+ 游戏厂商建立了深入合作,触达超过 2 亿用户。

超参数

成立时间及融资轮次:2019年 B轮(红杉中国领投,估值已达10亿独角兽,单轮融资1亿美元)

AIGC相关亮点:超参数科技提供的AI bot支持玩家陪玩、多人团队竞技(球球大作战)、非完美信息博弈AI(斗地主、德扑、麻将等)等。目前,超参数AI Bot已在多款千万日活的产品中上线,每日在线数峰值将近百万,业内率先实现在3D FPS领域的大规模商业化落地。

影谱科技

成立时间及融资轮次:2018年 D轮(单轮融资13.6亿元,商汤科技领投)

AIGC相关亮点:在视频生成相关领域支持结构化视觉分析、影像自动合成技术、智能视频编辑、视频内容生产等。

Zyro

围绕垂直业务场景,结合业务knowhow 组织相关AIGC能力

围绕电商场景,通过AIGC生成网站搭建过程中所需的各类素材,具体业务包括针对性生成公司介绍、企业价值、Slogan、自动提升图片清晰度、自动生成logo等。

聆心智能

基于多模态对话生成系统,该公司专注于针对精神心理的AI驱动的高质量数字疗法,让AI围绕认知、情绪和行为三个维度对用户进行评估和干预,生成千人千面的情绪治疗方案,目前已与北医六院、湘雅二院、中日友好医院、清华大学玉泉医院等达成合作。

OpenAI

将其底层模型对外开放商用,开创基础设施型的商业模式。GPT-3目前已经开始对外提供API,并分为四种模型按照用量对外收费。

Gliacloud

输入文本链接,软件能够自动对其中的标题和文字进行区分表示,并根据不同层级自动匹配素材和文字的转场、格式等,进而形成说明式的视频。该方式能够增加10倍的视频产量。类似公司包括:Gliacloud、Synths.video、lumen5、Pencil。

Rosebud.ai

Rosebud.ai能够生成非真实的人脸图像,并在该图像中匹配相关衣物等所需素材。此外,模型面孔可以根据对应受众的相关数据进行调整。该公司声称,其生成模型能够使活动点击率提升22%。

iplay20iplay50区别

酷比魔方 iPlay 50 采用前黑后灰配色,搭载紫光展锐虎贲 T618 八核处理器,2* Cortex A75+6*A55@2.0GHz,采用 850MHz 的 Mali-G52 MP2 GPU,性能大约相当于高通骁龙 670 或骁龙 710 的水平。

该平板电脑配备 10.36 英寸 1200*2000 分辨率的 LCD 屏,亮度 300 cd/㎡,尺寸为 248*157.8*8.4mm,重约 466 克,前置 5MP 自拍镜头,后置 8MP 镜头,支持 4G 全网通、双卡双待、双频 Wi-Fi、GPS、蓝牙 5.0。

该机还将配备 6000mAh 电池,支持 5V 2A 快充,提供 USB-C 接口和 3.5mm 耳机孔,BOX 音腔双扬声器,支持 2TB TF 卡扩展存储,运行基于安卓 12 系统的酷比魔方 OS。

openai价格(opaicn价格表)

从渲染图可以看到,该机电源键和音量键在机身的竖向顶部,底部则是 Type-C 接口、3.5mm 耳机孔、扬声器开孔。

IT之家了解到,酷比魔方 iPlay 50 可选“学习教育版”和“老年辅助版”,预计就是官方预热的“一个平板、三个系统”。

iplay20是原生系统。优点是十分精简。缺点也同样是过于精简。全面屏手势。手势截图。一键锁屏这些都需要自己去小小的折腾一下。只挂一个手势后台的话。4g运存能剩2.7g

续航:

虽说是28nm+6000毫安电池。使用续航却是出乎意料的好。酷比魔方iplay20日常使用报告酷比魔方iplay20日常使用报告因为这几天玩电子书比较多。所以平板充满电之后用了四五天才把电用到只剩百分之10的地步。中间有两个应用忘记关。后台一直挂了十几个小时。后面我就把所有不需要挂后台的应用全部冰箱冻了以后设置快捷启动。目测连续看视频大概能有9个多小时。打王者四个多小时。待机掉电很少。大概10小时百分之1。百分之2左右

总结:酷比魔方iplay20日常使用报告酷比魔方iplay20日常使用报告心急的朋友可以直接翻到这

机身做工有些一般。酷比魔方iplay20日常使用报告酷比魔方iplay20日常使用报告充满电大概要三四个小时。外放也就听个响的水平。而且由于两个扬声器都在底部的原因。横屏双持的时候手还容易把扬声孔堵了一个。另外。ota升级系统以后。若是有很多应用闪退或者应用出现一些本来没有的小问题的话可以恢复一下出厂。我之前还以为是兼容问题

对于不玩大游戏。只是看看视频漫画玩玩神庙逃亡之类小游戏的用户而言。这款平板还是很值的。除了二手以外。千元以下的10寸平板也没有更好的选择。各类寨板用的联发哥属实是拉跨。而台电那款p20hd除了外放比iplay20更好之外。酷比魔方iplay20日常使用报告酷比魔方iplay20日常使用报告使用的屏幕却是非全贴合屏幕。真是可惜了。

之前pdd最低入手价格是628。目前618活动也可以650左右入手。当然价格差的不多的话建议优先考虑jdtb。售后服务更好

目前闲鱼10寸625平板价格都在三四百块以上。内存都是2+16。3+16。2+32之类的蛇皮配置。而所谓pooi小问题也不少。这个买来玩一年。转手还能轻松卖个三四百块。几百块的东西降不了多少。再低就差不多白给了。美滋滋

特斯拉自动驾驶仪3D技术将成为即将爆发的新引擎

摘要

1. 特斯拉即将发布的3D更新将增加AI辅助驾驶功能。

2. 未能意识到特斯拉在自动驾驶技术上的竞争优势的分析师和投资者,将会突然觉醒。

3.大多数金融模型仍将特斯拉视为传统的 汽车 制造商,但这在未来将不再适用。

分析师和投资者系统性地低估了特斯拉(Tesla)在自动驾驶领域的竞争地位。对竞争环境的评估过于依赖于对演示视频中自动驾驶 汽车 性能的定性判断,以及其他公关、营销和品牌塑造活动。从 历史 上看,被指派到特斯拉的卖方分析师大多是 汽车 分析师,这意味着他们没有时间或精力深度学习和研究机器人技术。这意味着特斯拉的自主优势正在被低估,或者根本无法在市场上定价。

在我撰写关于特斯拉的文章的三年中,我一直坚持认为数据规模比几乎所有其他事情都重要。我也一次又一次地指出,认为特斯拉在自动驾驶方面的进展将是平稳而持续的,而不是磕磕绊绊、断断续续的。我推测,深度学习研发有两个阶段。数据收集和标记阶段可能相对快速。速度取决于公司在野外拥有的机器人数量以及它雇佣的数据标签工人数量。

接下来是一个缓慢而不可预测的阶段,人工智能科学家和工程师致力于构建一个系统,以适当的时间、合适的力度摄取标签数据并输出有用的机器人行为,比如转向、加速和刹车。获取数据就像给油箱加油。AI科学家和工程师的工作就像制造引擎一样。从里程表的角度来看,进展可能是什么都没有,然后,在一瞬间,点火开关被打开, 汽车 就启动了。

AI非线性发展的一个显著例子就是OpenAI在经典视频 游戏 Montezuma's Revenge上的突破。这张图表说明了一切:

在这种情况下,数据是从 游戏 中收集并自动标记,因此数据集创建阶段要比科学和工程阶段快得多。此外,蒙特祖玛(Montezuma)的复仇在AI社区的整体进展也不是顺利和持续的。

特斯拉在路上有超过90万个机器人。在美国,其所有竞争对手的合计机器人数量不到2000辆,而且鉴于大多数测试都在美国进行,因此全球总数可能不会高很多。深度神经网络的性能可预测地随着数据的变化而变化,这样的数据优势可以产生2倍到30倍的性能优势。

一个重要的警告是,数据需要手动或自动地标记。正如我所写的那样,特斯拉有许多很有前途的选择来自动标记数据,并使用其庞大的车队来使手动数据标记更加高效。(也就是说,在同样的人力资源中获得更多的神经网络性能。)特斯拉的AI科学家和工程师面临的挑战是,寻求这些选择,并让它们在商业规模上像在概念的学术证明中那样发挥作用。换句话说,就是制造一个能使用充足的燃料运行的引擎。

走向3D

显然,特斯拉AI团队目前最重要的工作是将计算机视觉从2D范式转换为3D范式。埃隆·马斯克(Elon Musk)在特斯拉第三行播客中首次描述了这一概念:

马斯克最近详细阐述了这一转变所涉及的工作:

“Whole Mars

@WholeMarsBlog

回复@elonmusk @romanhistory1和@HardcoreHistory

自动驾驶仪的重写怎么样了?

你们叫它 PlaidNet么?

Elon Musk

@elonmusk

顺利。团队很出色,和他们一起工作是一种荣耀。几乎所有的东西都需要重写,包括我们的标签软件,所以从训练到推理的每一步都是“3D”的。

2020年7月2日凌晨4:54”

2020年7月2日

回复了@elonmusk @WholeMarsBlog和其他两个博客

反向召唤有什么更新吗?

Elon Musk

@elonmusk

当我们转换到新的软件栈时,许多功能将同时发生。最有可能的是,它将在2到4个月内发布。接下来的问题是,什么样的功能被证明足够安全,可以让用户使用。

从2D到3D的转变意味着什么?就我所能猜测到的来说,这与传感器数据表示为神经网络有关。

LiDAR激光脉冲通过在光线撞击物体并返回传感器时创建一个点来创建周围物体的3D表示。世界的3D表示称为点云。

2018年,来自康奈尔大学的计算机视觉研究人员(包括王燕和赵卫麟)发表了一份预印本,显示可以使用相机来创建3D点云,更重要的是,使用这种形式的表示方式不是2D图像提高了神经网络使用相机预测深度的能力。相机可以通过立体视觉获得点,这也是人类和其他哺乳动物在一定距离下感知深度的方式。事实证明,使LiDAR(激光雷达)如此有效的不仅仅在于激光器,还有将LiDAR(激光雷达)输入解析为点云的常见做法。Wang等人将利用相机生成点云的方法称为“伪LiDAR(激光雷达)”。自2018年以来,其他研究人员也在此基础上开展了研究。

如今,至少在某些学术基准上,伪LiDAR及其相关方法(如伪LiDAR ++和ViDAR(代表可视LiDAR或视频LiDAR))在3D对象检测和深度估计上与匹配LiDAR非常接近。据我了解,伪LiDAR ++的准确度大约是流行的KITTI Vision基准上LiDAR的三分之一。

今年早些时候,特斯拉的AI高级总监安德烈·卡帕西(Andrej Karpathy)公开透露,特斯拉目前正在研究一种用于深度估算的伪LiDAR方法。回到2019年的自治日(Autonomy Day ),卡帕西演示了通过立体视觉获得的3D深度信息:

在他最近的演讲中,Karpathy分享了3D表示与2D表示中获得的准确性的一小部分。这些可视化显示了路缘检测,左侧是“ground truth”(可能来自LiDAR),右侧是使用2D表示的基于摄像头的检测,中间是使用3D表示的基于摄像头的检测:

如果这一定性的结果真正代表了特斯拉的整体性能提升,那么3D更新必将给特斯拉的AI辅助驾驶软件带来巨大的改进。从外部来看,这种改善会出现突发性和断续性。

钱来了

谈到特斯拉和自治(autonomy)方面,大多数分析师和投资者采取的是“我看到就相信”的态度。当然,这是他们的权利,但在我看来,这意味着低估了特斯拉在2021年及以后的收益和现金流。在实现完全的自动驾驶之前,特斯拉将继续大力推进AI辅助驾驶。特斯拉已经可以在红绿灯和停车标志前自动停车:

AI辅助驾驶可以说是特斯拉使用者最喜欢的功能,也是特斯拉和其他 汽车 之间最明显的区别。与之竞争的 汽车 制造商在实施无线软件更新这样的基础技术方面进展缓慢,据我所知,还没有一家公司像特斯拉那样,公开宣布计划围绕其 汽车 生产建立一个深度学习渠道。我相信,2021年以后,差异化软件将为特斯拉 汽车 带来更多需求。

对于没有其他附加组件的Model 3 Standard Range Plus,售价8,000美元的“完全自动驾驶功能”选项为购买价格的17%。这是一笔高利润收入,因为下载软件的边际成本可以忽略不计。马斯克多次表示,随着功能的增加,价格将会上涨。此外,特斯拉计划以每月订购的形式销售该软件。这必将扩大客户基础。

AI辅助驾驶软件带来的收入不断增长,意味着分析师们应该考虑特斯拉的预期利润率,而不是仅与其业内同行进行比较。此外,特斯拉在软件方面的优势证明了乐观的增长假设。

摩根士丹利(Morgan Stanley)的亚当·乔纳斯(Adam Jonas)最近发布了特斯拉2030年 汽车 销量为600万辆的看涨预测,认为特斯拉的股价将上涨2070美元。在我看来,考虑到特斯拉正步入 汽车 公司与人工智能(AI)和机器人公司之间的灰色地带,这种2030年的销量水平是合理的。目前尚不清楚,竞争对手如何能将 汽车 制造能力、软件和人工智能能力迅速合并,以减缓特斯拉目前的高速增长轨迹。因此,即使股价在1400美元左右,我仍然认为该股仍有很大的上涨空间。

我们还可以考虑 汽车 销售以外的问题。我预计,在“3D更新”向客户推出后,会有更多的分析师和投资者开始认真考虑机器人(robotaxis)出租车。虽然鉴于这种不确定性,很难知道如何为机器人出租车(robotaxis)的机会定价。然而,私人市场投资者已经通过Waymo (GOOG, GOOGL)和Cruise (GM)成功做到了这一点。为什么特斯拉无法在公众市场上做到这一点呢?

注:我/我们是long TSLA。这篇文章是我自己写的,表达了我自己的观点。我没有因此得到补偿(除了寻求阿尔法)。我和本文中提到的任何公司都没有业务关系。

英文原文:;li_medium=liftigniter-widget

(未经同意,请勿转载)