绿茶通用站群绿茶通用站群

鱼目混珠这个故事,鱼目混珠的典故

鱼目混珠这个故事,鱼目混珠的典故 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆(bào)以(yǐ)来,微软公司创始人比(bǐ)尔·盖茨(cí)已多(duō)次公开谈论人工(gōng)智能话题(tí)。在最(zuì)近(jìn)的一次(cì)采访中,他再次表示:“AI可能会(huì)让科技行业(yè)迎(yíng)来(lái)一(yī)次剧烈的洗牌”。

这个结论是他在当地时间(jiān)2月20日接受《In Good Company》节目专访时提出的。

他预期,AI的发(fā)展可能(néng)会威胁到谷歌的市占率,因为(wèi)微(wēi)软在AI方(fāng)面的行动相当迅速。而最终科技(jì)巨头将把(bǎ)AI整合成用户的“全能助手”,包揽一切(qiè)应(yīng)用(yòng),与人们进行(xíng)沟通并提供建议,可以取代亚(yà)马逊、Siri或(huò)Outlook等应用。

大佬口(kǒu)中(zhōng)全能助手的(de)到来可能尚需(xū)时日,但(dàn)由ControlNet引发的又一次AI绘(huì)画浪(làng)潮,让AIGC在ChatGPT的话(huà)题(tí)热点包围中杀出重(zhòng)围。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌(pái)科技(jì)行业?_黑(hēi)料正能量(liàng)

01

ControlNet颠覆(fù)AI绘画新(xīn)玩法(fǎ)

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火的时(shí)候,还(hái)是2022年8月,在美国(guó)科罗(luó)拉(lā)多(duō)州举办的新兴数字艺术家竞(jìng)赛中,一幅名(míng)为《太空歌剧院(yuàn)》的作(zuò)品获奖。

随后各大厂商的AI绘(huì)画(huà)软件被(bèi)广大网友熟知(zhī)并(bìng)体验,Stable Diffusion便是其中代表。

ChatGPT之后(hòu)又(yòu)一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业(yè)?_黑料正能量(liàng)

用(yòng)户们可以在(zài)应用中输入一组(zǔ)关键词或者一张照片,就能获(huò)得(dé)一幅AI创作的画作。

作(zuò)画的(de)关键就是所输入的文本(běn)。同一组关键(jiàn)词也可以(yǐ)创作出很多张风格(gé)不一样的画作,这(zhè)让创作的过程就像开盲盒。

很多(duō)用户很喜欢(huān)这(zhè)种不确定的惊喜,他们会将生成的美图(tú)当做头像。而另一(yī)部分喜欢(huān)翻看(kàn)AI绘(huì)画(huà)的“翻(fān)车”作品(pǐn)。在社(shè)交媒体上,许多(duō)用户分享(xiǎng)AI“翻车现场(chǎng)”,例(lì)如,一位网(wǎng)友的小狗照片被AI画成了“肌肉男(nán)”,还有网友的个人照片被(bèi)AI识别成(chéng)了(le)建筑(zhù)。

而如今随着ControlNet的出(chū)现(xiàn)与(yǔ)加持,以往AI绘画的填写关键(jiàn)词游戏可能要被颠覆了。

ChatGPT之后(hòu)又一应(yīng)用杀(shā)疯了(le),AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正(zhèng)能量

ControlNet是一位正在(zài)斯坦福读博的(de)中(zhōng)国人张吕敏创作的一种基于控制点的图(tú)像(xiàng)变(biàn)形(xíng)算法,主要用于数字图像处理、计算机视觉(jué)和计(jì)算机图形(xíng)学等领域。

其SD插件一(yī)经发布,在短(duǎn)短的两天内(nèi)便成为了(le)AI绘画领域(yù)最新的(de)热(rè)点。

在(zài)此(cǐ)之前(qián),大家用了很(hěn)多方(fāng)法(fǎ)想让AI生成的结果尽可(kě)能的符合要求,但是都不尽如人意,它的出现代(dài)表着(zhe)AI生成开(kāi)始(shǐ)进(jìn)入真正(zhèng)的可控时期。

因为ControlNet可以直(zhí)接提取画面的构(gòu)图,人物(wù)的姿(zī)势(shì)和画(huà)面(miàn)的深度信息等。有了它的(de)帮助,就(jiù)不用频繁的(de)用提示词(cí)来碰运气,抽(chōu)盲盒式的创(chuàng)作了。

通俗的说(shuō)ControlNet相当于给AI绘(huì)画加了“魔法”,不少博(bó)主的作品(pǐn)已经获得了大量的浏览量,“viggo”就是其中之一,他用朋友的(de)照片直接带她们走进动漫世界。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌科技行业(yè)?_黑料正(zhèng)能量

viggo先用StableDiffusion图(tú)片转文字。

再用Text2Prompt插件拓展(zhǎn)找到对应的关(guān)键(jiàn)词;最后用(yòng)ControlNet插件绑定(dìng)骨骼开始换关键词(cí)试效(xiào)果。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能量(liàng)

通过图(tú)片就可以看(kàn)出来,效果十分惊(jīng)艳。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑(hēi)料(liào)正能量

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业?_黑(hēi)料正(zhèng)能量

更(gèng)厉害的是,除了真实的照片,草图也可以(yǐ)加(jiā)上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能实现线稿转全彩图。大(dà)神张吕敏其本(běn)尊也亲自回应。

ChatGPT之后又一应用杀(shā)疯了(le),AIGC或进入可(kě)控期,将洗牌科(kē)技行业?_黑料(liào)正能量

不(bù)得不说当下(xià)AIGC已经(jīng)变得越来越强大,甚至输出的作品(pǐn)都已经能以假(jiǎ)乱(luàn)真了。

02

难辨虚实,AIGC技术(shù)力(lì)爆(bào)发

警惕安全问题

近日,“苏州金鸡(jī)湖有游艇party”的消息火遍网络,而经过警(jǐng)方辟谣(yáo)这所谓的“party”可能是全国(guó)第一起AI绘(huì)图诈骗。

由于这个(gè)活(huó)动里面给出(chū)的美女照片都是AI制(zhì)作的真人照片绘图,因为太(tài)逼(bī)真(zhēn),被大(dà)家(jiā)当成真(zhēn)事(shì)传播了

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控期,将洗(xǐ)牌科技(jì)行(xíng)业?_黑料正能量

不过(guò)仔细观察(chá)可(kě)以(yǐ)发(fā)现,活动发起者提供的照片(piàn)中有个(gè)很大(dà)的漏(lòu)洞(dòng)可以(yǐ)发(fā)现并非真人,而(ér)是AI绘图(tú),那便是图片中女性的(de)手指部分有的存在异常(cháng)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技(jì)行业?_黑(hēi)料正(zhèng)能量(liàng)

有行业人事表示:“现(xiàn)在因为手(shǒu)指(zhǐ)部分(fēn)的绘画(huà)算(suàn)法比较复杂,AI还不太会画(huà)人(rén)的手(shǒu),但最(zuì)新(xīn)看到的图(tú)片已经有(yǒu)越(yuè)来越完(wán)美(měi)的AI模型(xíng)出现,以后可能就完全(quán)没(méi)有漏洞了。

类似的AI作图诈骗在国(guó)外也已有发生(shēng)。据英国广播公(gōng)司报道(dào),土(tǔ)耳其地震期间,有Tiktok用户使用AI合成了儿童受(shòu)灾的假照片发布到网(wǎng)络,以此诱骗善(shàn)良的(de)人打赏“捐助”从而实施诈骗。

目前随着技术发展,AIGC已(yǐ)经(jīng)能做(zuò)出真(zhēn)人照片(piàn)般的绘图效果,如果这样(yàng)的图(tú)片被用来诈骗,将非常可怕。

此外(wài)AIGC还引发了很多(duō)担忧(yōu),一方(fāng)面(miàn),批判者认为AI在“学习”了大量前人的作品之后,其创作没有任何情绪和灵魂,难以和人类的艺术创(chuàng)作相(xiāng)提并论。

另一方面,AIGC背(bèi)后的版(bǎn)权、目前都并没有得到有(yǒu)效的解(jiě)决,还(hái)有AIGC会不会(huì)代替人类“至高(gāo)无上”的(de)创意。

马斯克也强调,人(rén)工智能(néng)的安全问题需要(yào)得到重视,太晚就(jiù)来不及了。

03

AIGC下一站(zhàn)除了视频,还有远(yuǎn)方

技术(shù)都(dōu)是有(yǒu)两面性的,潜在(zài)的(de)危害并不能掩盖其(qí)光(guāng)辉(huī)的贡献(xiàn)。现(xiàn)在看来,人工智(zhì)能技术将是第四次工业革(gé)命的核心(xīn)驱(qū)动力量,将(jiāng)创造新的增长奇迹(jì)。

过去(qù)一年,人工智能在技术和商业层面都有了(le)巨大进展,AI绘画(huà)就是人工智能技(jì)术发生方向性改变的一个代表(biǎo)。其(qí)下一站或许(xǔ)就是视(shì)频。

此(cǐ)前,Meta和谷歌先后发(fā)布了(le)几条(tiáo)引(yǐn)爆科技圈(quān)的短视频。这些视(shì)频引发关(guān)注并非(fēi)内容做得多优秀,反而都非常(cháng)简单(dān),比如一匹正在喝水的马,一只画(huà)画的玩具熊,或(huò)者一段骑摩托车的(de)第一(yī)视角录像,随便(biàn)一(yī)个有手(shǒu)机的人都可以随手(shǒu)录下(xià)一段。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入(rù)可(kě)控(kòng)期,将洗牌科技行业?_黑料正能量

但这些短视(shì)频的创作方式非(fēi)常简单,创作者仅仅需要(yào)向AI输入(rù)一段话,甚至只是说(shuō)一下要求,AI就可以根据需要生成一段(duàn)视频。

谷歌发布的两个(gè)AI生成视(shì)频分别来自于(yú)Imagen Video和Phenaki,前(qián)者主要突出(chū)的是高清,与Meta的Make-A-Video没有(yǒu)太多的(de)差别。

在Make-A-Video公布了AI生成的(de)视频后,AI圈就已经玩了一波梗,一个能够做(zuò)出更高清(qīng)视(shì)频的AI还(hái)不(bù)足(zú)以在短(duǎn)时(shí)间内戳中兴奋(fèn)点。

Phenaki更(gèng)加令人震惊的地方(fāng)在于(yú),它可以制作出超过2分钟的连(lián)贯的也有确切(qiè)内容的视频,这才(cái)是真正让(ràng)人们感到惊(jīng)喜(xǐ)的地方。因为无(wú)论AI生成的视频多么高(gāo)清(qīng),也只(zhǐ)能(néng)是为内容生产者提供(gōng)一个灵感(gǎn),一个素材,一个(gè)过场动画。

不过(guò)能够制作出有具体剧(jù)情内容(róng)的视(shì)频就意(yì)味着,一些视频创(chuàng)作由AI代替人工完(wán)成已(yǐ)经初步有了可(kě)能。

当下AI的发展速度(dù)已经超(chāo)过大部分人的想(xiǎng)象。内容(róng)产业的本质是供给创(chuàng)造需求,AIGC作为全(quán)新的内容生产(chǎn)方式,可以为(wèi)内容产业(yè)带来更新的(de)内(nèi)容风(fēng)格、更快的生(shēng)产速度,更低(dī)的生产成本(běn),这无(wú)疑会驱动内容产业的大爆发。

除了AI绘(huì)图(tú)、视(shì)频,AIGC技术还能应用于(yú)音(yīn)乐(lè)、代码、机器人动作等(děng)多种(zhǒng)内容(róng)形式的生成。不难发(fā)现(xiàn)该项技(jì)术不仅(jǐn)在游戏等行业能得到有(yǒu)效应用,对于下一代(dài)互联网各(gè)种元(yuán)素的构建(jiàn)亦(yì)有关键意义。

从商(shāng)业化的角度来看(kàn),文化娱乐、教(jiào)育、传媒等诸多领域,本身就对基于AI的可视(shì)化内容(róng)有强(qiáng)烈需(xū)求。

因此,AI绘(huì)画(huà)及视频或不是结果,而只(zhǐ)是AI进程中的一块重要(yào)拼图(tú),有望(wàng)在技术更新(xīn)的加(jiā)持下(xià)实(shí)现更大的应用(yòng)价值。

AI从理解(jiě)内容,走向了(le)可以生(shēng)成内容,甚至能够创造出独立价值和独立(lì)视(shì)角的内容(róng)。AIGC的再次出圈,更(gèng)代(dài)表着未来的先(xiān)进生产力即将到来(lái)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科(kē)技行业?_黑料正能量

04

紧(jǐn)抓大(dà)模型与算力(lì),牢固AIGC底座

从技术的(de)发展也(yě)可(kě)以看出,在语言(yán)大模型、图像大模型(xíng)之后,多模(mó)态大模型(xíng)已经成为了新(xīn)的趋势。

大模型被誉为当前(qián)人(rén)工智(zhì)能发展(zhǎn)的智能底座,是全球竞争最(zuì)激烈的(de)研究方(fāng)向之一(yī),包括谷歌、亚马逊、百度(dù)、阿(ā)里(lǐ)、腾(téng)讯等众多(duō)头(tóu)部(bù)企业都在(zài)竞相发力。

不(bù)过(guò)训(xùn)练(liàn)大模型的确价格不(bù)菲,以(yǐ)国(guó)盛证券发布的(de)《ChatGPT需(xū)要多少(shǎo)算力》报告估算,GPT-3训练一次的成本约(yuē)为140万美元。而对于一些(xiē)更大的LLM(大(dà)型语言模型),训练成本则介于200万美元至1200万美元高价(jià)之间。

以ChatGPT在2023年1月(yuè)的独立访客平均(jūn)数1300万计算,其对应芯片需(xū)求为3万多片英伟达A100 GPU,初始投入成本约为(wèi)8亿(yì)美元(yuán),每(měi)日仅电费(fèi)就在(zài)5万(wàn)美元左右(yòu)。

ChatGPT之后又一应用杀疯(fēng)了(le),AIGC或进(jìn)入可控期,将洗(xǐ)牌科技行业?_黑料正(zhèng)能量

此外不(bù)论是ChatGPT还是(shì)AIGC,都离不开庞大算力支持。在关注各类(lèi)大模型的(de)发展(zhǎn)同时,更应(yīng)该关注(zhù)算力网络的建设。

算力(lì)网络正驱动AI产业发展进入(rù)史诗级加(jiā)速进程,让AIGC及(jí)通用AI这一人工智能发展的终极(jí)目标离得更近。

因为算(suàn)力(lì)可以对突破(pò)性(xìng)技术(shù)创新提供大(dà)力的支持。这方(fāng)面,多模态大模型是典(diǎn)型。作为面向未来强人工智能、通(tōng)用(yòng)人工智能的重要技术创新,多模态(tài)大模型已经在人工智(zhì)能领(lǐng)域提出了很多(duō)年,业界也有(yǒu)不少技(jì)术突(tū)破,但是,多模态大模(mó)型进一步往下走(zǒu),算力需(xū)求(qiú)呈(chéng)几何式(shì)上升(shēng),一(yī)般的算力(lì)基(jī)础设施很快将难以胜任(rèn)。

从图(tú)像、文字、语音单独一项的训(xùn)练,到(dào)双模(mó)态、三模态的跃迁,让人工智能可(kě)以灵(líng)活应对不同(tóng)模态(tài)的转化(huà)、像(xiàng)人与世界交互一样自然,这方(fāng)面,由(yóu)算力网(wǎng)络来驱(qū)动将有明显优势。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌科(kē)技行业?_黑料正能量

此外,还有很多(duō)需要爆发式增长(zhǎng)的算力来(lái)支(zhī)撑(chēng)的技术创新,将在(zài)人工智能算(suàn)力网络(luò)支撑下快速推进。

AIGC已经(jīng)露(lù)出曙(shǔ)光,期待在(zài)大模型和(hé)大算(suàn)力的(de)支(zhī)持下AIGC能持续(xù)颠覆内容生产的方式,将创造(zào)的边际(jì)成本降低,让万众受益(yì)。

未经允许不得转载:绿茶通用站群 鱼目混珠这个故事,鱼目混珠的典故

评论

5+2=