绿茶通用站群绿茶通用站群

嘴巴含胸的感觉知乎

嘴巴含胸的感觉知乎 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天机器人ChatGPT火爆以来,微软公(gōng)司创始人比尔·盖茨已多次公开谈(tán)论人工智能话题。在最(zuì)近的(de)一次采访中,他再次表(biǎo)示:“AI可(kě)能会让科技行业(yè)迎来一次剧(jù)烈的洗牌”。

这(zhè)个结论是他(tā)在当地(dì)时间(jiān)2月20日接受《In Good Company》节(jié)目专访(fǎng)时提出(chū)的。

他预期,AI的发展可能(néng)会威(wēi)胁到谷歌的市(shì)占率(lǜ),因为微软在AI方面的行动相当迅速。而(ér)最(zuì)终(zhōng)科技巨头将把AI整合成用户的“全能助手(shǒu)”,包(bāo)揽(lǎn)一切应(yīng)用,与人们进行(xíng)沟通并(bìng)提供建(jiàn)议,可以取代亚马(mǎ)逊(xùn)、Siri或Outlook等应(yīng)用。

大佬口中全能助(zhù)手的到来可能(néng)尚需(xū)时日,但(dàn)由ControlNet引发的又一次AI绘画浪潮(cháo),让AIGC在(zài)ChatGPT的话(huà)题热点包(bāo)围(wéi)中杀(shā)出重围(wéi)。

ChatGPT之后(hòu)又一应(yīng)用杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料(liào)正能(néng)量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控靠近(jìn)

以AI绘画为代表的AIGC上一次爆火的时(shí)候,还是2022年8月(yuè),在美国科罗拉多州举办(bàn)的新兴数字(zì)艺(yì)术家竞赛中,一幅名为(wèi)《太空(kōng)歌剧院》的作品获(huò)奖。

随(suí)后各(gè)大厂商的AI绘画软件被(bèi)广大网友熟知并(bìng)体验(yàn),Stable Diffusion便是(shì)其中代表。

ChatGPT之后又一应(yīng)用(yòng)杀疯了,AIGC或(huò)进入可(kě)控期,将洗牌科技行业?_黑料正能(néng)量(liàng)

用户们可以在应用中输入一组(zǔ)关(guān)键词(cí)或者一张照片,就能获得一幅AI创作的画作。

作画的关键就(jiù)是所(suǒ)输入的(de)文本。同一(yī)组关键(jiàn)词也嘴巴含胸的感觉知乎可以创作出很(hěn)多张风格不一样的画作,这让创作的过(guò)程就(jiù)像开盲盒。

很多用户很喜欢这种不(bù)确(què)定的惊喜,他们会将生成的美图当(dāng)做头像。而另一部分(fēn)喜(xǐ)欢翻(fān)看AI绘画的(de)“翻(fān)车”作品。在社交媒体(tǐ)上,许(xǔ)多用户分享AI“翻车(chē)现场”,例如,一位网友的小狗照(zhào)片被AI画成(chéng)了“肌肉男”,还有网友的(de)个人照片被AI识别成了建筑(zhù)。

而如今随着ControlNet的(de)出现(xiàn)与(yǔ)加持,以往AI绘画的(de)填写关键词游戏(xì)可能要被颠覆了(le)。

ChatGPT之(zhī)后又一应用杀疯了(le),AIGC或进(jìn)入可控(kòng)期,将(jiāng)洗(xǐ)牌科技行(xíng)业(yè)?_黑(hēi)料(liào)正能量

ControlNet是一位正在斯坦福(fú)读博的中国人张吕敏创(chuàng)作的(de)一(yī)种基于控(kòng)制点的图像变形(xíng)算法,主(zhǔ)要用于数(shù)字(zì)图(tú)像(xiàng)处理(lǐ)、计算机视觉和计算机图形学(xué)等领(lǐng)域。

其SD插件一经发布,在短短的两(liǎng)天内便成为了AI绘画(huà)领域最新的热点。

在此之前,大(dà)家(jiā)用(yòng)了(le)很多方法想让AI生成的结果尽可能的符合要求(qiú),但(dàn)是都不尽(jǐn)如人意,它的出现代(dài)表着AI生成开始进(jìn)入真正的可控时期(qī)。

因(yīn)为(wèi)ControlNet可以直接提取(qǔ)画面的(de)构图,人物的姿势和画面的深度信(xìn)息(xī)等。有了它的帮(bāng)助,就不用(yòng)频繁(fán)的用提示词(cí)来碰运气,抽盲盒式的创作了(le)。

通俗的说ControlNet相当(dāng)于给AI绘画加了“魔法”,不少博主的(de)作品已经获得了大量的浏(liú)览量,“viggo”就是(shì)其中之一,他用(yòng)朋友的照片直接(jiē)带(dài)她们走(zǒu)进动漫世界。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技(jì)行业?_黑料正能量

viggo先用StableDiffusion图片转文字(zì)。

再用Text2Prompt插件拓展(zhǎn)找到(dào)对(duì)应的关键(jiàn)词;最后(hòu)用(yòng)ControlNet插(chā)件绑定骨骼开始(shǐ)换关(guān)键词试效果(guǒ)。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技行业?_黑(hēi)料正(zhèng)能量

通(tōng)过图(tú)片(piàn)就(jiù)可以看(kàn)出来,效果(guǒ)十分惊艳。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技(jì)行业(yè)?_黑料正能量

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技行业?_黑料正(zhèng)能量

更(gèng)厉害的(de)是,除(chú)了(le)真实(shí)的照片,草图也可以加上“魔法(fǎ)”,知乎(hū)大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实现线(xiàn)稿(gǎo)转(zhuǎn)全彩图。大神张吕(lǚ)敏其(qí)本尊也亲(qīn)自回应(yīng)。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技(jì)行业?_黑料(liào)正能(néng)量

不得不说当下(xià)AIGC已(yǐ)经变得(dé)越(yuè)来越(yuè)强大,甚至输出的作品都(dōu)已经能(néng)以假乱真(zhēn)了(le)。

02

难辨虚(xū)实,AIGC技术力(lì)爆发(fā)

警(jǐng)惕(tì)安全问题

近日,“苏(sū)州金鸡(jī)湖有(yǒu)游艇party”的消息火遍网络(luò),而经过警方辟(pì)谣这所谓的“party”可能是全国第一起AI绘图诈骗。

由于这个活动(dòng)里面给出的美女(nǚ)照片都是AI制作(zuò)的真人照片绘图,因(yīn)为太逼(bī)真,被(bèi)大家当成真(zhēn)事传播了

ChatGPT之后又一应(yīng)用(yòng)杀疯了,AIGC或进入可(kě)控期,将洗牌(pái)科技行业?_黑料正能量

不过(guò)仔细观(guān)察可以发(fā)现,活动发起者提(tí)供的照片中有个很大的漏洞可以(yǐ)发(fā)现并非真人(rén),而是(shì)AI绘图,那便是图片中女性的手指(zhǐ)部分有的存(cún)在异常。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可(kě)控期(qī),将洗牌科技行业?_黑料(liào)正能量

有行(xíng)业人事表(biǎo)示(shì):“现在(zài)因为手指部分(fēn)的绘(huì)画算法比较复杂,AI还不太会画人的手(shǒu),但(dàn)最新看(kàn)到的图片已(yǐ)经(jīng)有越来(lái)越(yuè)完美的AI模型(xíng)出(chū)现,以后可能就完全没有(yǒu)漏洞了。

类似的AI作图诈骗在(zài)国外也已有发生。据英国广播(bō)公司报道,土耳其地震期间,有(yǒu)Tiktok用(yòng)户使用AI合成了儿童受灾的假照片发布到(dào)网络(luò),以此诱骗善良的人打赏(shǎng)“捐助(zhù)”从而实施诈骗。

目(mù)前随着技(jì)术发(fā)展(zhǎn),AIGC已经能做出真人照片般的(de)绘图效(xiào)果,如果这(zhè)样的(de)图片被(bèi)用来(lái)诈骗,将非常可怕。

此外(wài)AIGC还引发了很多担忧,一(yī)方面,批(pī)判者认为AI在(zài)“学习”了大量前(qián)人的作(zuò)品之后,其创(chuàng)作没有任何情绪和灵魂,难以和人(rén)类的艺术创(chuàng)作相提并论。

另一方面,AIGC背后的版权、目前都并没有得(dé)到有效的解决,还有AIGC会(huì)不(bù)会代替(tì)人类“至高(gāo)无上”的创意(yì)。

马斯克也强调,人工智能的(de)安全问(wèn)题(tí)需要得到重视,太晚(wǎn)就来不及了。

03

AIGC下(xià)一站除了视频(pín),还有(yǒu)远方

技术都是有两面性的(de),潜在的(de)危害并不能掩盖其光(guāng)辉的贡献。现(xiàn)在看来,人工智能(néng)技术将是第四(sì)次工业(yè)革命(mìng)的核心驱动力量,将创造(zào)新的增长奇迹。

过(guò)去(qù)一(yī)年,人工智能在技(jì)术和商业层(céng)面(miàn)都有了巨大进(jìn)展,AI绘画(huà)就是人工智能技术发生方向性改(gǎi)变的一个代表。其下(xià)一站或许(xǔ)就是视频。

此前,Meta和谷(gǔ)歌先后发布(bù)了几条引爆科技圈的短视频。这些视(shì)频(pín)引发关注(zhù)并非内容做得多优秀,反而(ér)都非常(cháng)简单,比(bǐ)如一匹正在喝水(shuǐ)的(de)马,一只画画的(de)玩具(jù)熊(xióng),或者(zhě)一段骑摩托车的第一视角录像,随(suí)便(biàn)一个有手(shǒu)机(jī)的人都可(kě)以随手录(lù)下一段。

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科(kē)技行业?_黑料正(zhèng)能量

但这些短视频(pín)的创作方(fāng)式非(fēi)常简(jiǎn)单,创作者(zhě)仅仅需(xū)要向(xiàng)AI输入一段话(huà),甚至只是(shì)说一下要求,AI就可以根(gēn)据(jù)需要生成一段视频。

谷(gǔ)歌发布的两个AI生成视(shì)频分别来自于Imagen Video和(hé)Phenaki,前者主要突出的(de)是高(gāo)清,与Meta的Make-A-Video没有太多的差别。

在Make-A-Video公布(bù)了AI生成的视频后,AI圈就已经(jīng)玩(wán)了一波(bō)梗,一(yī)个(gè)能够做出更高清视频的AI还不(bù)足以在短时(shí)间内(nèi)戳中兴奋点。

Phenaki更加令人震惊的地(dì)方在于,它可以制作(zuò)出超(chāo)过(guò)2分钟的连(lián)贯的也有确切(qiè)内容(róng)的视频,这才是真正让(ràng)人(rén)们感(gǎn)到(dào)惊喜(xǐ)的地方(fāng)。因为无(wú)论AI生成的视频多么高清(qīng),也(yě)只能是为内(nèi)容(róng)生产者提(tí)供一(yī)个灵感,一个素材(cái),一(yī)个过场动画。

不过能够制(zhì)作出有(yǒu)具体剧情(qíng)内(nèi)容的视频就(jiù)意味着,一(yī)些(xiē)视频创作(zuò)由AI代替人(rén)工(gōng)完成已经初(chū)步(bù)有了可能。

当下AI的发展速度已经超过大部(bù)分人的想象(xiàng)。内容产业的本质是供(gōng)给(gěi)创造需求,AIGC作(zuò)为全新的内(nèi)容生(shēng)产方(fāng)式,可以为内容产业带来更(gèng)新的内容风格、更快(kuài)的生产(chǎn)速度,更低的生产成(chéng)本,这无嘴巴含胸的感觉知乎(wú)疑会驱动内容产业的大爆发。

除了AI绘图、视(shì)频,AIGC技(jì)术(shù)还能应用于音乐(lè)、代码、机器人动(dòng)作(zuò)等多种内容形式的生成。不难(nán)发现(xiàn)该(gāi)项技(jì)术不仅(jǐn)在游戏(xì)等行业能得到(dào)有效应(yīng)用,对于下一代互联(lián)网(wǎng)各(gè)种(zhǒng)元素的构建亦(yì)有关(guān)键(jiàn)意义。

从商业(yè)化的角度来看,文(wén)化娱乐(lè)、教(jiào)育、传(chuán)媒(méi)等诸(zhū)多领域,本身就(jiù)对基于(yú)AI的可视化内容有强烈需求。

因(yīn)此,AI绘(huì)画及视频或不(bù)是结(jié)果,而(ér)只是AI进程中的(de)一块(kuài)重要拼图,有望在技术更新(xīn)的加持下实现更大的应用价值。

AI从理解内(nèi)容,走向了可(kě)以(yǐ)生(shēng)成内容,甚至能够创造(zào)出独立价值(zhí)和独立视(shì)角(jiǎo)的(de)内(nèi)容。AIGC的再(zài)次出圈,更代表着未来的先进生产力即将到来。

ChatGPT之后又(yòu)一(yī)应用杀疯了(le),AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量

04

紧抓大模型与算力,牢固AIGC底(dǐ)座

从技术(shù)的发展也可以看出,在语言大模型、图像大模(mó)型之后(hòu),多模态(tài)大模型已(yǐ)经成为(wèi)了新的趋势。

大模型被誉为当前人(rén)工(gōng)智能发展(zhǎn)的智能底座,是全球(qiú)竞争最激烈的研究方向之一,包括谷歌、亚马逊(xùn)、百(bǎi)度(dù)、阿里、腾(téng)讯等众多头部企业(yè)都(dōu)在竞相发力。

不过(guò)训练大模型(xíng)的确(què)价格不菲,以国盛证(zhèng)券发布的《ChatGPT需要多少算力》报告估算,GPT-3训练(liàn)一次的成本(běn)约为140万美元。而对于一些更大(dà)的LLM(大(dà)型语言模型),训练成本则介于200万美元至1200万美元高价之间。

以ChatGPT在2023年(nián)1月(yuè)的独立访客平均(jūn)数1300万计算,其对应芯(xīn)片需求为3万多片英伟(wěi)达A100 GPU,初始(shǐ)投入成本约(yuē)为8亿美元,每(měi)日仅电(diàn)费就在5万美元(yuán)左右(yòu)。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌科(kē)技行业?_黑料正能量

此外不论是ChatGPT还是AIGC,都离不开庞大算力支持。在(zài)关注各类大模型的发展同时,更应该关注算力网(wǎng)络的建设。

算力网络正驱动AI产(chǎn)业发展进入史诗级加速进程(chéng),让(ràng)AIGC及通用AI这(zhè)一人(rén)工智(zhì)能发展(zhǎn)的终极目(mù)标离得(dé)更近。

因为(wèi)算力可以对突(tū)破性(xìng)技术创新(xīn)提供大力的支持(chí)。这(zhè)方(fāng)面(miàn),多模态大(dà)模型(xíng)是典型。作为(wèi)面向未来强人工(gōng)智能、通用人(rén)工智能的重要技术创(chuàng)新,多模(mó)态大(dà)模型已经在人(rén)工智能领域提出了很(hěn)多年,业(yè)界也有不(bù)少技术突(tū)破,但是,多(duō)模(mó)态大(dà)模型进一步往下走,算力需(xū)求呈几何式上(shàng)升,一般的算力基础设施很(hěn)快将难以胜任(rèn)。

从图(tú)像、文字、语音单(dān)独一项的训练(liàn),到双模态、三模态的跃迁,让人(rén)工智能可以(yǐ)灵活应对不同模态(tài)的转化(huà)、像(xiàng)人与世界交互(hù)一样自然,这方面,由(yóu)算力网络来驱动(dòng)将有明显优势。

ChatGPT之(zhī)后又(yòu)一(yī)应用(yòng)杀疯了,AIGC或进(jìn)入可控期(qī),将洗牌科(kē)技(jì)行业(yè)?_黑料正能(néng)量

此(cǐ)外(wài),还(hái)有很(hěn)多需要爆发式增(zēng)长的算(suàn)力来支撑的技术创新,将(jiāng)在人工智能算力网络(luò)支撑下快速推进。

AIGC已经露出曙光,期待在大模型和大算(suàn)力的支持下AIGC能持续颠覆内(nèi)容(róng)生产的方(fāng)式,将创(chuàng)造的边际成(chéng)本降(jiàng)低,让万众(zhòng)受益。

未经允许不得转载:绿茶通用站群 嘴巴含胸的感觉知乎

评论

5+2=