深圳市腾众软件科技有限公司深圳市腾众软件科技有限公司

张大大到底是什么来头

张大大到底是什么来头 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天机器人ChatGPT火爆以来,微软公司创始人(rén)比尔·盖茨已多次公开谈论人(rén)工(gōng)智能话题。在最近的一次采(cǎi)访中,他再次(cì)表示:“AI可(kě)能(néng)会让(ràng)科技行业迎来一(yī)次剧烈的洗(xǐ)牌”。

这个(gè)结论是他(tā)在当地时间(jiān)2月20日接受《In Good Company》节目专访时提出的。

他预期,AI的发展可能会威胁到谷歌的市占率,因为微软在AI方面的行(xíng)动相(xiāng)当迅速。而最终科技巨头将把AI整合成用户的“全能助手”,包揽一切应用,与人们进行沟通(tōng)并提供(gōng)建议,可以取(qǔ)代(dài)亚马逊、Siri或(huò)Outlook等应用。

大佬口(kǒu)中全能(néng)助手的到来可能(néng)尚需时日,但由ControlNet引发(fā)的又一(yī)次AI绘画浪潮,让AIGC在ChatGPT的(de)话题热点包围中(zhōng)杀(shā)出重围(wéi)。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或(huò)进(jìn)入可(kě)控期,将(jiāng)洗(xǐ)牌(pái)科技行业?_黑料正(zhèng)能量张大大到底是什么来头ropx2="1000" data-cropy1="0" data-cropy2="503.46020761245677" data-ratio="0.503" data-s="300,640" data-type="jpeg" data-w="1000">

01

ControlNet颠覆AI绘画新玩法

AIGC向(xiàng)可控靠近

以AI绘(huì)画为代表的(de)AIGC上一次爆(bào)火(huǒ)的时候,还是2022年8月,在美国科(kē)罗拉多州(zhōu)举(jǔ)办的(de)新(xīn)兴数字艺术家竞赛中,一幅名为(wèi)《太空歌剧院》的作(zuò)品(pǐn)获(huò)奖(jiǎng)。

随后各大(dà)厂(chǎng)商(shāng)的AI绘画软件被(bèi)广(guǎng)大网友熟(shú)知并体验,Stable Diffusion便是其中代表。

ChatGPT之(zhī)后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科(kē)技行业?_黑料正能(néng)量

用户(hù)们可以在应(yīng)用中输入一组(zǔ)关键词或者一(yī)张(zhāng)照片,就能获得一幅(fú)AI创作的画作。

作画的关键就是(shì)所(suǒ)输入的文本(běn)。同一组(zǔ)关键词也可以(yǐ)创作出很(hěn)多张风格(gé)不一样的画作,这让创作的过程就(jiù)像开盲盒。

很多用户很喜欢这种不确定的惊喜,他们会将生成的美图当做头像。而另一部分喜欢翻看AI绘画的(de)“翻车”作品。在社交媒体上,许(xǔ)多(duō)用户分(fēn)享(xiǎng)AI“翻车现(xiàn)场”,例如,一位网友的小(xiǎo)狗照片被AI画成了“肌肉男”,还有(yǒu)网友的个(gè)人照片被AI识别(bié)成(chéng)了(le)建筑。

而如今随着(zhe)ControlNet的(de)出现(xiàn)与加持,以往AI绘画的填写(xiě)关键词游戏可(kě)能要被(bèi)颠覆了。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可(kě)控(kòng)期,将洗牌科技行业(yè)?_黑料正能量

ControlNet是一位(wèi)正在斯坦福读(dú)博的中国人(rén)张吕(lǚ)敏创作的(de)一种基于控制(zhì)点的图像(xiàng)变形算法(fǎ),主要用于数字图像处(chù)理、计算(suàn)机(jī)视觉(jué)和计(jì)算机图形学等领域。

其SD插(chā)件一经发布,在短短(duǎn)的(de)两天(tiān)内(nèi)便成为了AI绘(huì)画领域最新的热点。

在此(cǐ)之前,大家用了很多方法想让AI生(shēng)成的结果尽可能的符合(hé)要求(qiú),但是都不(bù)尽如人意,它的出现代表着AI生(shēng)成开始(shǐ)进(jìn)入真正(zhèng)的可控时期。

因(yīn)为(wèi)ControlNet可以直(zhí)接提取画面(miàn)的(de)构图,人物的姿(zī)势和(hé)画面的深度信息等。有了它(tā)的帮助,就不用(yòng)频繁的用提示词来碰运气,抽(chōu)盲盒式(shì)的创作了(le)。

通俗(sú)的说(shuō)ControlNet相当(dāng)于给AI绘画加了“魔法”,不少博(bó)主(zhǔ)的(de)作品已经获得了(le)大量的浏览量(liàng),“viggo”就是其(qí)中之(zhī)一,他(tā)用朋友的照片直接带她们走进动(dòng)漫世界。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业(yè)?_黑料正能量

viggo先用(yòng)StableDiffusion图(tú)片转文字。

再用Text2Prompt插件拓展找(zhǎo)到对应(yīng)的关键(jiàn)词;最后用ControlNet插件绑定骨骼开始换关键词试效(xiào)果。

ChatGPT之后(hòu)又(yòu)一应(yīng)用杀疯(fēng)了,AIGC或进(jìn)入可控期(qī),将洗牌科(kē)技行业?_黑料(liào)正能量

通过图片就可(kě)以看出来,效果十分惊(jīng)艳。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进(jìn)入(rù)可控期,将洗(xǐ)牌科(kē)技行(xíng)业(yè)?_黑料正(zhèng)能(néng)量

ChatGPT之后(hòu)又(yòu)一应用杀疯(fēng)了,AIGC或进入可控期(qī),将洗(xǐ)牌科技行业?_黑料正能量(liàng)

更厉害的是(shì),除了真实的照片(piàn),草图也可以加上(shàng)“魔(mó)法(fǎ)”,知(zhī)乎大(dà)牛“DevPoint”和“逗砂”介(jiè)绍到ControlNet还能(néng)实现线(xiàn)稿转全彩图。大神(shén)张吕(lǚ)敏其本尊也亲自回(huí)应(yīng)。

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le),AIGC或进入可(kě)控期,将(jiāng)洗牌科技(jì)行业?_黑料正(zhèng)能量

不得不说当下AIGC已经(jīng)变得越来越强大,甚至输(shū)出的(de)作(zuò)品都已经能(néng)以假乱真了。

02

难辨虚实,AIGC技术(shù)力爆(bào)发

警(jǐng)惕安全问题

近日,“苏州金鸡湖有游艇(tǐng)party”的消息(xī)火遍网络,而(ér)经过警方辟谣这所谓的“party”可能是全国第一起AI绘图诈骗。

由(yóu)于这个活动里面给出的美女照片都是AI制(zhì)作的真(zhēn)人照片绘(huì)图,因为太逼真,被大家当(dāng)成真事传(chuán)播了

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或(huò)进(jìn)入可控期,将洗牌科技行业?_黑料(liào)正能量

不(bù)过仔(zǎi)细观察可以发现,活(huó)动发起者(zhě)提供的(de)照片中有(yǒu)个(gè)很大的漏洞可以发现并非(fēi)真人,而(ér)是AI绘图(tú),那便是图(tú)片(piàn)中女性的手(shǒu)指部分有(yǒu)的存在异常(cháng)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗(xǐ)牌科技行业?_黑(hēi)料正(zhèng)能量

有行业人事表(biǎo)示(shì):“现在(zài)因为手指(zhǐ)部分的(de)绘(huì)画(huà)算法比较复杂(zá),AI还不太会画(huà)人(rén)的手,但最新看(kàn)到的图片已经(jīng)有越来越(yuè)完美的AI模型出现,以后可(kě)能就完全没(méi)有漏洞(dòng)了。

类似的AI作图诈(zhà)骗在国(guó)外(wài)也已有发(fā)生。据英国广播公(gōng)司(sī)报道,土耳其地(dì)震期(qī)间,有Tiktok用户使用AI合成了儿童受灾的假照片发布到网络,以此诱骗善(shàn)良的人打赏“捐助”从而实施诈骗。

目前随着(zhe)技术发展(zhǎn),AIGC已经能做出真(zhēn)人照片般的绘图(tú)效果(guǒ),如果这样的图片被用来(lái)诈骗,将(jiāng)非(fēi)常可(kě)怕。

此外AIGC还引(yǐn)发(fā)了很多担忧,一方面,批(pī)判者认为(wèi)AI在“学习(xí)”了大量前人(rén)的(de)作(zuò)品之后,其创作没有任何(hé)情绪和灵魂,难以和人(rén)类的艺术创(chuàng)作(zuò)相(xiāng)提并论。

另(lìng)一方面,AIGC背后的版权、目前(qián)都并没有得到有效的解(jiě)决,还有AIGC会不(bù)会代替人类“至高无上”的(de)创意。

马斯(sī)克也强(qiáng)调,人工(gōng)智(zhì)能的安全问题需(xū)要得(dé)到重视(shì),太晚就来(lái)不及了。

03

AIGC下(xià)一站除了视频,还(hái)有远方

技(jì)术都是(shì)有两面性的,潜在的危害并不能掩(yǎn)盖其光辉的贡献(xiàn)。现在看来,人工智能技术将是第四次工(gōng)业革命的(de)核心驱(qū)动力量(liàng),将创造新的(de)增长(zhǎng)奇(qí)迹(jì)。

过去一年,人(rén)工智能在技术和商业(yè)层面都有了巨大进展,AI绘画就是人工智能技术发生方向性改(gǎi)变的一个代(dài)表。其下一站或(huò)许就是视(shì)频。

此前,Meta和谷歌先(xiān)后发布了(le)几条引(yǐn)爆科技圈的短视频。这些视频引(yǐn)发关(guān)注(zhù)并非内(nèi)容(róng)做(zuò)得多优秀,反(fǎn)而都(dōu)非常简单(dān),比如(rú)一匹正在喝水的马,一(yī)只画画的玩具熊,或者一段骑摩托车的第一视角录(lù)像,随便一个(gè)有手机的人都可以随手录下一段(duàn)。

ChatGPT之(zhī)后(hòu)又(yòu)一应用杀疯了,AIGC或进入可(kě)控(kòng)期,将洗牌(pái)科技(jì)行业?_黑料正能(néng)量

但这些短视频的创作方式非(fēi)常简(jiǎn)单,创(chuàng)作(zuò)者仅仅需要(yào)向AI输入一段话,甚至只是说(shuō)一下要求,AI就可(kě)以根据需要生成(chéng)一段视频。

谷歌发布的两个AI生成视频(pín)分别来自于(yú)Imagen Video和Phenaki,前(qián)者主要(yào)突(tū)出的是高清,与Meta的Make-A-Video没有太(tài)多的差别。

在(zài)Make-A-Video公布了AI生(shēng)成(chéng)的视频后(hòu),AI圈就已经玩了一波(bō)梗,一(yī)个(gè)能(néng)够做出更高清视频的(de)AI还(hái)不足(zú)以在短(duǎn)时间(jiān)内戳中兴奋(fèn)点。

Phenaki更加令人震(zhèn)惊的地方在于,它可以制作出超过2分钟的连(lián)贯(guàn)的也有确切(qiè)内容的视频,这才是真正让人们感到惊喜的地方(fāng)。因为无论AI生成(chéng)的视频多么高清,也只能(néng)是(shì)为内容(róng)生产(chǎn)者提供一个灵感(gǎn),一(yī)个(gè)素材(cái),一个(gè)过场动画。

不过能(néng)够制(zhì)作出(chū)有具体剧情内(nèi)容的视频(pín)就意味着,一些视(shì)频创作由AI代替人工(gōng)完成已经(jīng)初步有了可能。

当下AI的发展速度已经超过大(dà)部分(fēn)人的想象。内容(róng)产业的本质是供给创造需求,AIGC作为(wèi)全新(xīn)的内容生产(chǎn)方式,可以为内容产业带来更新的内(nèi)容风格(gé)、更快的生产(chǎn)速度(dù),更低(dī)的(de)生产成本,这无(wú)疑(yí)会驱动内(nèi)容产业(yè)的大爆发(fā)。

除(chú)了AI绘图、视(shì)频,AIGC技术还能应用于音乐、代码(mǎ)、机器(qì)人动作等多(duō)种内容形式的生成。不难(nán)发现该项技术(shù)不仅在(zài)游戏等行业能(néng)得到有效应(yīng)用,对于下一代互(hù)联网各种元素(sù)的构建亦有关键意义。

从商(shāng)业化的角度(dù)来看,文化(huà)娱乐、教育、传媒等诸多领域,本身(shēn)就对基(jī)于AI的可视化内容有(yǒu)强烈(liè)需求。

因此(cǐ),AI绘画及视频(pín)或(huò)不是(shì)结果,而只(zhǐ)是AI进程中(zhōng)的(de)一块(kuài)重要拼(pīn)图,有望(wàng)在技术更新的加持(chí)下(xià)实现更(gèng)大(dà)的应用价值。

AI从理解内容,走向了(le)可以生成内容(róng),甚至能(néng)够创造出独立价值和独立视角的内容。AIGC的再次(cì)出圈,更代(dài)表着未来的先进生产力即将到来。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业?_黑料(liào)正能量

04

紧抓大模型与算(suàn)力,牢固AIGC底座

从技术(shù)的发展也可以(y张大大到底是什么来头ǐ)看出(chū),在语言大模型、图(tú)像大模型之(zhī)后,多模态大模型(xíng)已经成为了新的趋(qū)势。

大模型被誉(yù)为当(dāng)前人(rén)工(gōng)智能发展的(de)智能底座(zuò),是全(quán)球(qiú)竞争最(zuì)激烈的研(yán)究方向之一,包括谷歌、亚马逊、百度、阿里、腾(téng)讯(xùn)等众多头(tóu)部企业都(dōu)在竞相发力。

不过训练大模型(xíng)的(de)确价(jià)格(gé)不菲,以国盛证券发布(bù)的《ChatGPT需要多(duō)少算力》报(bào)告估算,GPT-3训练一(yī)次的成本约(yuē)为140万(wàn)美元。而对于一些更大的LLM(大(dà)型语言(yán)模(mó)型),训练成(chéng)本则介于200万美(měi)元至1200万美元高(gāo)价之间。

以ChatGPT在2023年1月的独立访(fǎng)客(kè)平均数1300万计算,其对应(yīng)芯片需(xū)求为(wèi)3万多片英伟达A100 GPU,初始投入(rù)成本约为(wèi)8亿美元,每日仅电费就在(zài)5万美元左右。

ChatGPT之后又一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料正能量

此外不论是ChatGPT还是(shì)AIGC,都离不开庞大算力支持。在关(guān)注(zhù)各类大模型的发(fā)展同时,更应该关注算(suàn)力网络的建设。

算力网(wǎng)络正驱动AI产(chǎn)业发(fā)展进入史诗级加速进程(chéng),让AIGC及(jí)通用AI这(zhè)一人工(gōng)智(zhì)能发展的终(zhōng)极(jí)目标离(lí)得更近(jìn)。

因为算力可以(yǐ)对突破性技术创新(xīn)提(tí)供大力的(de)支持。这方面,多(duō)模态大模型是典型。作为(wèi)面(miàn)向未来强(qiáng)人工智能(néng)、通用人(rén)工智(zhì)能的重要技(jì)术创新,多模态大(dà)模型(xíng)已经在(zài)人工(gōng)智(zhì)能领域提出了很多(duō)年,业界也(yě)有不少技(jì)术突破,但(dàn)是,多模态大模型进一步往下走,算力(lì)需求呈几何式上升,一般(bān)的算力(lì)基础设施很快(kuài)将(jiāng)难以胜任(rèn)。

从图像、文字(zì)、语音单独一项的训练,到(dào)双模态、三模态(tài)的跃迁,让人工智(zhì)能可以(yǐ)灵(líng)活应(yīng)对(duì)不同模态(tài)的转化、像人与世界交互一样自然,这方面,由算力网络(luò)来驱动将有明(míng)显优势(shì)。

ChatGPT之后又一(yī)应用(yòng)杀疯(fēng)了(le),AIGC或(huò)进入(rù)可(kě)控期,将洗牌科技行业?_黑(hēi)料正能量

此外(wài),还有(yǒu)很多需要爆发式增长的算力来(lái)支撑的技术创新,将在人(rén)工智能算力网络(luò)支撑下快速推进。

AIGC已经露出曙光,期待在大模(mó)型和大算力的支持下AIGC能持续颠覆内(nèi)容生产(chǎn)的方式,将创(chuàng)造的(de)边际(jì)成(chéng)本(běn)降低(dī),让万众受益。

未经允许不得转载:深圳市腾众软件科技有限公司 张大大到底是什么来头

评论

5+2=