鱼目混珠这个故事，鱼目混珠的典故-绿茶通用站群

鱼目混珠这个故事，鱼目混珠的典故 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人ChatGPT火爆(bào)以(yǐ)来，微软公司创始人比(bǐ)尔·盖茨(cí)已多(duō)次公开谈论人工(gōng)智能话题(tí)。在最(zuì)近(jìn)的一次(cì)采访中，他再次表示：“AI可能会(huì)让科技行业(yè)迎(yíng)来(lái)一(yī)次剧烈的洗牌”。

这个结论是他在当地时间(jiān)2月20日接受《In Good Company》节目专访时提出的。

他预期，AI的发(fā)展可能(néng)会威胁到谷歌的市占率，因为(wèi)微(wēi)软在AI方(fāng)面的行动相当迅速。而最终科技(jì)巨头将把(bǎ)AI整合成用户的“全能助手”，包揽一切(qiè)应(yīng)用(yòng)，与人们进行(xíng)沟通并提供建议，可以取代亚(yà)马逊、Siri或(huò)Outlook等应用。

大佬口(kǒu)中(zhōng)全能助手的(de)到来可能尚需(xū)时日，但(dàn)由ControlNet引发的又一次AI绘(huì)画浪(làng)潮，让AIGC在ChatGPT的话(huà)题(tí)热点包围中杀出重(zhòng)围。

ChatGPT之(zhī)后又一应用(yòng)杀疯了，AIGC或进入可控期，将洗牌(pái)科技(jì)行业？_黑(hēi)料正能量(liàng)

ControlNet颠覆(fù)AI绘画新(xīn)玩法(fǎ)

AIGC向可控靠近

以AI绘画为代表的AIGC上一次爆火的时(shí)候，还(hái)是2022年8月，在美国(guó)科罗(luó)拉(lā)多(duō)州举办的新兴数字艺术家竞(jìng)赛中，一幅名(míng)为《太空歌剧院(yuàn)》的作(zuò)品获奖。

随后各大厂商的AI绘(huì)画(huà)软件被(bèi)广大网友熟知(zhī)并(bìng)体验，Stable Diffusion便是其中代表。

用(yòng)户们可以在(zài)应用中输入一组(zǔ)关键词或者一张照片，就能获(huò)得(dé)一幅AI创作的画作。

作(zuò)画的(de)关键就是所输入的文本(běn)。同一组关键(jiàn)词也可以(yǐ)创作出很多张风格(gé)不一样的画作，这(zhè)让创作的过程就像开盲盒。

很多(duō)用户很喜欢(huān)这(zhè)种不确定的惊喜，他们会将生成的美图(tú)当做头像。而另一(yī)部分喜欢(huān)翻看(kàn)AI绘(huì)画(huà)的“翻(fān)车”作品(pǐn)。在社(shè)交媒体上，许多(duō)用户分享(xiǎng)AI“翻车现场(chǎng)”，例(lì)如，一位网(wǎng)友的小狗照片被AI画成了“肌肉男(nán)”，还有网友的个人照片被(bèi)AI识别成(chéng)了(le)建筑(zhù)。

而如今随着ControlNet的出(chū)现(xiàn)与(yǔ)加持，以往AI绘画的填写关键(jiàn)词游戏可能要被颠覆了。

ControlNet是一位正在(zài)斯坦福读博的(de)中(zhōng)国人张吕敏创作的一种基于控制点的图(tú)像(xiàng)变(biàn)形(xíng)算法，主要用于数字图像处理、计算机视觉(jué)和计(jì)算机图形(xíng)学等领域。

其SD插件一(yī)经发布，在短(duǎn)短的两天内(nèi)便成为了(le)AI绘画领域(yù)最新的(de)热(rè)点。

在(zài)此(cǐ)之前(qián)，大家用了很(hěn)多方(fāng)法(fǎ)想让AI生成的结果尽可(kě)能的符合要求，但是都不尽如人意，它的出现代(dài)表着(zhe)AI生成开(kāi)始(shǐ)进(jìn)入真正(zhèng)的可控时期。

因为ControlNet可以直(zhí)接提取画面的构(gòu)图，人物(wù)的姿(zī)势(shì)和画(huà)面(miàn)的深度信息等。有了它的(de)帮助，就(jiù)不用频繁的(de)用提示词(cí)来碰运气，抽(chōu)盲盒式的创(chuàng)作了。

通俗的说(shuō)ControlNet相当于给AI绘(huì)画加了“魔法”，不少博(bó)主的作品(pǐn)已经获得了大量的浏览量，“viggo”就是其中之一，他用朋友的(de)照片直接带她们走进动漫世界。

viggo先用StableDiffusion图(tú)片转文字。

再用Text2Prompt插件拓展(zhǎn)找到对应的关(guān)键(jiàn)词；最后用(yòng)ControlNet插件绑定(dìng)骨骼开始换关键词(cí)试效(xiào)果。

通过图(tú)片就可以看(kàn)出来，效果十分惊(jīng)艳。

更(gèng)厉害的是，除了真实的照片，草图也可以(yǐ)加(jiā)上“魔法”，知乎大牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能实现线稿转全彩图。大(dà)神张吕敏其本(běn)尊也亲自回应。

不(bù)得不说当下(xià)AIGC已经(jīng)变得越来越强大，甚至输出的作品(pǐn)都已经能以假(jiǎ)乱(luàn)真了。

难辨虚实，AIGC技术(shù)力(lì)爆(bào)发

警惕安全问题

近日，“苏州金鸡(jī)湖有游艇party”的消息火遍网络，而经过警(jǐng)方辟谣(yáo)这所谓的“party”可能是全国(guó)第一起AI绘(huì)图诈骗。

由于这个(gè)活(huó)动里面给出(chū)的美女照片都是AI制(zhì)作的真人照片绘图，因为太(tài)逼(bī)真(zhēn)，被大(dà)家(jiā)当成真(zhēn)事(shì)传播了。

不过(guò)仔细观察(chá)可(kě)以(yǐ)发(fā)现，活动发起者提供的照片(piàn)中有个(gè)很大(dà)的漏(lòu)洞(dòng)可以(yǐ)发(fā)现并非真人，而(ér)是AI绘图(tú)，那便是图片中女性的(de)手指部分有的存在异常(cháng)。

ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌(pái)科技(jì)行业？_黑(hēi)料正(zhèng)能量(liàng)

有行业人事表示：“现(xiàn)在因为手(shǒu)指(zhǐ)部分(fēn)的绘画(huà)算(suàn)法比较复杂，AI还不太会画(huà)人(rén)的手(shǒu)，但最(zuì)新(xīn)看到的图(tú)片已经有(yǒu)越(yuè)来越完(wán)美(měi)的AI模型(xíng)出现，以后可能就完全(quán)没(méi)有漏洞了。”

类似的AI作图诈骗在国(guó)外也已有发生(shēng)。据英国广播公(gōng)司报道(dào)，土(tǔ)耳其地震期间，有Tiktok用户使用AI合成了儿童受(shòu)灾的假照片发布到网(wǎng)络，以此诱骗善(shàn)良的(de)人打赏“捐助”从而实施诈骗。

目前随着技术发展，AIGC已(yǐ)经(jīng)能做(zuò)出真(zhēn)人照片(piàn)般的绘图效果，如果这样(yàng)的图(tú)片被用来诈骗，将非常可怕。

此外(wài)AIGC还引发了很多(duō)担忧(yōu)，一方(fāng)面(miàn)，批判者认为AI在“学习”了大量前人的作品之后，其创作没有任何情绪和灵魂，难以和人类的艺术创(chuàng)作相(xiāng)提并论。

另一方面，AIGC背(bèi)后的版(bǎn)权、目前都并没有得到有(yǒu)效的解(jiě)决，还(hái)有AIGC会不会(huì)代替人类“至高(gāo)无上”的(de)创意。

马斯克也强调，人(rén)工智能(néng)的安全问题需要(yào)得到重视，太晚就(jiù)来不及了。

AIGC下一站(zhàn)除了视频，还有远(yuǎn)方

技术(shù)都(dōu)是有(yǒu)两面性的，潜在(zài)的(de)危害并不能掩盖其(qí)光(guāng)辉(huī)的贡献(xiàn)。现(xiàn)在看来，人工智(zhì)能技术将是第四次工业革(gé)命的核心(xīn)驱(qū)动力量，将(jiāng)创造新的增长奇迹(jì)。

过去(qù)一年，人工智能在技术和商业层面都有了(le)巨大进展，AI绘画(huà)就是人工智能技(jì)术发生方向性改变的一个代表(biǎo)。其(qí)下一站或许(xǔ)就是视(shì)频。

此(cǐ)前，Meta和谷歌先后发(fā)布了(le)几条(tiáo)引(yǐn)爆科技圈(quān)的短视频。这些视(shì)频引发关(guān)注并非(fēi)内容做得多优秀，反而都非常(cháng)简单(dān)，比如一匹正在喝水的马，一只画(huà)画的玩具熊，或(huò)者一段骑摩托车的(de)第一(yī)视角录像，随便(biàn)一(yī)个有手(shǒu)机的人都可以随手(shǒu)录下(xià)一段。

但这些短视(shì)频的创作方式非(fēi)常简单，创作者仅仅需要(yào)向AI输入(rù)一段话，甚至只是说(shuō)一下要求，AI就可以根据需要生成一段(duàn)视频。

谷歌发布的两个(gè)AI生成视(shì)频分别来自于(yú)Imagen Video和Phenaki，前(qián)者主要突出(chū)的是高清，与Meta的Make-A-Video没有(yǒu)太多的(de)差别。

在Make-A-Video公布了AI生成的(de)视频后，AI圈就已经玩了一波梗，一个能够做(zuò)出更高清(qīng)视(shì)频的AI还(hái)不(bù)足(zú)以在短(duǎn)时(shí)间内戳中兴奋(fèn)点。

Phenaki更(gèng)加令人震惊的地方(fāng)在于(yú)，它可以制作出超过2分钟的连(lián)贯的也有确切(qiè)内容的视频，这才(cái)是真正让(ràng)人们感到惊(jīng)喜(xǐ)的地方。因为无(wú)论AI生成的视频多么高(gāo)清(qīng)，也只(zhǐ)能(néng)是为内容生产者提供(gōng)一个灵感(gǎn)，一个素材，一个(gè)过场动画。

不过(guò)能够制作出有具体剧(jù)情内容(róng)的视(shì)频就意(yì)味着，一些视频创(chuàng)作由AI代替人工完(wán)成已(yǐ)经初步有了可(kě)能。

当下AI的发展速度(dù)已经超(chāo)过大部分人的想(xiǎng)象。内容(róng)产业的本质是供给创(chuàng)造需求，AIGC作为全(quán)新的内容生产(chǎn)方式，可以为(wèi)内容产业(yè)带来更新的(de)内(nèi)容风(fēng)格、更快的生(shēng)产速度，更低(dī)的生产成本(běn)，这无(wú)疑会驱动内容产业的大爆发。

除了AI绘(huì)图(tú)、视(shì)频，AIGC技术还能应用于(yú)音(yīn)乐(lè)、代码、机器人动作等(děng)多种(zhǒng)内容(róng)形式的生成。不难发(fā)现(xiàn)该项技(jì)术不仅(jǐn)在游戏等行业能得到有(yǒu)效应用，对于下一代(dài)互联网各(gè)种元(yuán)素的构建(jiàn)亦(yì)有关键意义。

从商(shāng)业化的角度来看(kàn)，文化娱乐、教(jiào)育、传媒等诸多领域，本身就对基于AI的可视(shì)化内容(róng)有强(qiáng)烈需(xū)求。

因此，AI绘(huì)画(huà)及视频或不是结果，而只(zhǐ)是AI进程中的一块重要(yào)拼图(tú)，有望(wàng)在技术更新(xīn)的加(jiā)持下(xià)实(shí)现更大的应用(yòng)价值。

AI从理解(jiě)内容，走向了(le)可以生(shēng)成内容，甚至能够创造出独立价值和独立(lì)视(shì)角的内容(róng)。AIGC的再次出圈，更(gèng)代(dài)表着未来的先(xiān)进生产力即将到来(lái)。

紧(jǐn)抓大(dà)模型与算力(lì)，牢固AIGC底座

从技术的(de)发展也(yě)可(kě)以看出，在语言(yán)大模型、图像大模型(xíng)之后，多模(mó)态大模型(xíng)已经成为了新(xīn)的趋势。

大模型被誉为当前(qián)人(rén)工智(zhì)能发展(zhǎn)的智能底座，是全球竞争最(zuì)激烈的(de)研究方(fāng)向之一(yī)，包括谷歌、亚马逊、百度(dù)、阿(ā)里(lǐ)、腾(téng)讯等众多(duō)头(tóu)部(bù)企业都在(zài)竞相发力。

不(bù)过(guò)训(xùn)练(liàn)大模型的确价格不(bù)菲，以(yǐ)国(guó)盛证券发布的(de)《ChatGPT需(xū)要多少(shǎo)算力》报告估算，GPT-3训练一次的成本约(yuē)为140万美元。而对于一些(xiē)更大的LLM(大(dà)型语言模型)，训练成本则介于200万美元至1200万美元高价(jià)之间。

以ChatGPT在2023年1月(yuè)的独立访客平均(jūn)数1300万计算，其对应芯片需(xū)求为3万多片英伟达A100 GPU，初始投入成本约为(wèi)8亿(yì)美元(yuán)，每(měi)日仅电费(fèi)就在(zài)5万(wàn)美元左右(yòu)。

此外不(bù)论是ChatGPT还是(shì)AIGC，都离不开庞大算力支持。在关注各类(lèi)大模型的(de)发展(zhǎn)同时，更应(yīng)该关注(zhù)算力网络的建设。

算力(lì)网络正驱动AI产业发展进入(rù)史诗级加(jiā)速进程，让AIGC及(jí)通用AI这一人工智能发展的终极(jí)目标离得更近。

因为算(suàn)力(lì)可以对突破(pò)性(xìng)技术(shù)创新提供大(dà)力的支持。这方(fāng)面，多模态大模型是典(diǎn)型。作为面向未来强人工智能、通(tōng)用(yòng)人工智能的重要技术创新，多模态(tài)大模型已经在人工智(zhì)能领(lǐng)域提出了很多(duō)年，业界也有(yǒu)不少技(jì)术突(tū)破，但是，多模态大模(mó)型进一步往下走(zǒu)，算力需(xū)求(qiú)呈(chéng)几何式(shì)上升(shēng)，一(yī)般的算力(lì)基(jī)础设施很快将难以胜任(rèn)。

从图(tú)像、文字、语音单独一项的训(xùn)练，到(dào)双模(mó)态、三模态的跃迁，让人工智能可(kě)以灵(líng)活应对不同(tóng)模态(tài)的转化(huà)、像(xiàng)人与世界交互一样自然，这方(fāng)面，由(yóu)算力网(wǎng)络来驱(qū)动将有明显优势。