图灵工业镜头 年度烂片,一个个男神全瞎了

小编 2024-11-24 行业应用 23 0

年度烂片,一个个男神全瞎了

《奇异博士》

本尼。

《蜘蛛侠》荷兰弟。

《X战警》野兽汉克尼古拉斯·霍尔特。

《蝙蝠侠大战超人》反派佐德将军迈克尔·珊农。

以及《神奇动物》女主角蒂娜的凯瑟琳·沃特斯顿。

……

看卡司,他们是在演让马丁·斯科塞斯“肝肠寸断”的漫威电影吗?

不是。

题材很严肃,格局很恢弘。

19世纪末,一场能够改变人类进程,科技与商业的大型撕逼。

主人公,爱迪生。

《电力之战》

The Current War

结果呢?

依然让人肝肠寸断。

口口声声说冲奥,却推迟了两年才上映。

口碑惨不忍睹。

IMDb 6.4,豆瓣6.5,MTC直接不及格的50分,全都是对这部大作的抨击。

各方评价是:

看完才发现这部电影最带劲的原来只有它的名字。如此梦幻的卡司也扛不住流水账的节奏,看到最后也没有看出所谓的“战”在哪

《电力之战》迫使观众花大量的时间在它的美学上,以至于很容易忘记它的主旨,或者说因为太无聊而懒得继续看下去。

年度惨案。

如此炸裂的阵容被辜负,谁的锅?

走出课本的爱迪生

韦恩斯坦的锅?

一部分。

2年前,他把这部电影当做冲奥的杀手锏。

但随着Me Too事件席卷好莱坞,韦恩斯坦不仅被奥斯卡组委会、英国电影和电视艺术学院和制片人工会扫地出门,更因多宗性侵事件被提告。

失去了强力公关的《电力之战》在多伦多电影首映就遭遇口碑滑铁卢,惨遭撤档延期,彻底与奥斯卡无缘。

直到今年,《电力之战》才重见天日。

一人出事,拖累全组。但这部年度惨案电影的惨,还不仅在于延期撤档。

看完全片以后,Sir觉得,《电力之战》之所以扑街,不能完全怪韦恩斯坦。

先看剧情,本来是很有卖点的。

本可以是一根针的楔入,去探讨“时代变局下的人性与魔性”。

两派力量,抢什么?

你我现在每天都要用,没了它就没法过日子的——

现在我们都知道,电流分为交流电和直流电两种,交流电就是平时我们用的插头取的电,而直流电就是5号7号电池啊,手机锂电等等。

但当年,电的使用仍未普及,到底是交流电还是直流电更适合日常生活和工业发展,仍处讨论中。

因此,推广直流电的托马斯·爱迪生和支持交流电的乔治·威斯汀豪斯展开了一场改变人类历史的竞争。

换句话说,两个有独立人格的人,被历史选择上了PK台,二选一,成王败寇。

直流电领队。

爱迪生 (本尼迪克特·康伯巴奇 饰),无人不知的超级发明家,一生拥有1500多项发明,白炽灯是他发明的,当时的直流电网也是由他设计,同时还是爱迪生电灯公司(后为通用电气公司)的创始人。

当他的白炽灯开始渐渐替代燃油灯成为普遍照明工具后,爱迪生开始了将他的直流电网扩展到全美的宏图大计。

这个计划不仅吸引到摩根公司等大财团给他投资,获得更多的研发资本和客户,更令他本身就巨大的名声,更上一层楼。

而且爱迪生本身就是个营销大师,非常善于利用媒体和舆论给自己宣传。

但问题就在于,直流电的局限性。

直流电的中心供电系统只能覆盖直径一英里的距离,更远的距离则无法满足,因此要不断地建造电站来实现传送。

这么一对比,交流电的优点就凸显出来了,不仅能长距离输送,而且成本更低,同时对于电能的消耗也相对较少。

交流电领队。

乔治·威斯汀豪斯 (迈克尔·珊农 饰)并非等闲之辈。不仅发明了汽闸,令铁路运输安全得到保障,更成立了威斯汀豪斯电气公司,手握400多项和铁路有关的专利。同时,对交流电进行研究并研发出交流电网。

没过多久,威斯汀豪斯的交流电网就成为了爱迪生直流电网的最大竞争对手。

越来越多人看好交流电的发展前景,投资也自然上门来了。

但作为电领域大佬中的大佬,爱迪生当然不爽。

为了保证直流电的推广和使用,爱迪生不得不借用媒体舆论对交流电进行各种致命攻击。

因为交流电虽然便捷,却存在着安全隐患,电压一旦控制不当,就很容易产生死亡事故。

爱迪生狠抓着这一点不放,不仅让下属用交流电电死动物给媒体做实验,让他们大肆报道。

另一方面,他向政府提供执行死刑的电椅的制作方法,但把锅推给威斯汀豪斯一方。

很显然,小学语文课本里的人物,古早励志鸡汤的C位,爱迪生成为守旧阻新、阴损自私的“魔鬼”。

这一手“反人设”,本来还挺震撼的。

双方进入胶着的白热化竞争。

新与旧,势均力敌。

倘若想要破局,只能引入第三方。

这场大战的关键人物特斯拉 (尼古拉斯·霍尔特 饰)登场了。

初到乍来的特斯拉到爱迪生公司做打工仔,因为爱迪生说只要他解决了发电机的问题就给他五万美元(在当时算是个大数目了)。

就在特斯拉真的解决掉问题以后,“奸商”爱迪生就开始耍赖不给钱,甚至还嘲笑塞尔维亚裔的特斯拉不懂美国式幽默。

一气之下,特斯拉离开了爱迪生公司,然后就开始搞事情。

其实就在特斯拉给爱迪生打工的时候,就已经预见交流电广阔的前景,他甚至不止一次向自己的偶像爱迪生推荐改用自己做出的交流电机设计。

但爱迪生不仅拒绝,还觉得他的设计毫无前途且浪费时间。

就在特斯拉粉转黑的一瞬间,这场电力之战的结局就已经写好了。

苦无投资的特斯拉和威斯汀豪斯一拍即合,后者不仅给他时间和经费制作出交流电机,更支持他完成对尼亚加拉大瀑布交流发电站这个伟大构想。

就在全世界瞩目的哥伦比亚世界博览会(电影里是芝加哥)来临之际,爱迪生最终错失了投标,威斯汀豪斯成为唯一的照明供应商。

这场轰轰烈烈的电力之战,以爱迪生的失败而告终。

剧情被转述,说到这儿,似乎也还很有戏。

这不就是项羽刚愎自用,韩信倒戈刘邦的故事吗?

资本让人膨胀,欲望让人冒险,而竞争的输赢冥冥中早已被写死。

PPT大片

故事按说拍出来不比国内那些低维度的“宫斗”“职场”戏差。

但是,导演活生生把戏拍死,拍成炫技式MV。

执着于给好戏做美图秀秀。

画面确实美轮美奂,有设计感。

比如爱迪生在经历这场战役期间心理变化,被背景的色调洞穿,从明媚的亮色过渡到黑暗,最终变成血红。

多角度的俯视镜头意图拍出那个时代的恢弘感,大量的特写和逆光镜头鲜明地展现出角色的表情和人物的形象。

甚至为了令观众感受到那个时代,电影对1893年哥伦比亚世界博览会进行了像素级的还原。

但是,还是那句老话。

形式大于内容,趣味绑架思考,虚荣破坏初心。

口碑的崩坏就是从这里开始。

就像爱迪生站到自己曾经反抗的对立面——

那个顽固不化的老家伙,把自己给作死了。

你看到的,是历史书上的编年表,变成了会动的PPT

时间节点一个接一个蹦出来,历史事件一件一件演给你看。

人物也因此被扁平化、脸谱化。

爱迪生是个只会造谣的混蛋。

威斯汀豪斯是“圣人”,只想造福全人类。

特斯拉就是一直在抱怨的憋屈小移民,“反骨仔”。

而Sir对这三个角色想追问的问题,却没有得到答案。

爱迪生到底在怕什么?

威斯汀豪斯渴望名利吗?

特斯拉有没有野心?

天才的沦落

故事流水账,角色走过场。

最关键的失败——全片没有立起来任何一个“人”

卡司,的确很多。

但他们更多的作用,是放在影片宣传的序目里。

比如荷兰弟。

IMDb上的番位,荷兰弟名列前茅。

电影中呢?

抱歉,戏份加起来没超过5场。

那篇幅最多的主角呢?

更令人可惜。

Sir最可惜的是本尼。

继“神探夏洛克”、图灵、阿桑奇、梵高、霍金等角色之后,本尼又双叒叕再一次饰演“天才”角色。

谁让他看起来就像脑子好使的样子。

但是在片中,他却沦为一个纯粹的情绪发泄机器

当然,有几次宣泄的确看出本尼演技的含金量。

一幕怒斥威斯汀豪斯和其他发明家偷他发明的戏份,以及妻子去世他来不及陪伴的懊悔戏分。

此外,都是重复。

戏里,天才沦落了;戏外,戏骨哑炮了。

爱迪生可以说是本尼近年来最无聊的角色。

这个锅,除了本尼对角色的重复选择外,导演的责任最大。

回看整部电影,有且只有一幕能打动Sir。

电影放映机的诞生。

这个瞬间,不仅是爱迪生顿悟的瞬间,也是作为重度影迷的Sir最有感觉的一幕。

机器缓缓启动,镜头伸进透不进光的黑盒子里。

梦幻一幕出现——

人的眼睛,和光影拼接出的幻象,交替闪烁。

虚与实交错,造梦的机器与爱迪生面对的现实,相互照应。

这一瞬间,本应是升华人物的跳板。

可惜。

人物还是再一次迷失在无来由的情绪中。

结尾,他得知自己失去投标后,回到家中,看着儿子观察电影放映原型机失神。

紧接着,他让儿子将自己的“梦想地图”一一敲碎。

怨天尤人的情绪再次泛滥。

而刚营造起来的,人物与时代暗中勾连的余味,鸡飞蛋打。

Sir当然懂,导演企图用一个伟大人物的失败营造反差。

但这种反差,干瘪又套路。

Sir想起另一部电影,《社交网络》

同样是传记,同样是一个划时代的伟大人物。

同样,以失败作结。

但它怎么拍?

电影最后一镜,没有任何情绪,渲染,夸张。

当时,主角马克·扎克伯格(杰西·艾森伯格饰)的公司Facebook,爆炸式发展,累积用户超一百万。

但,他也面对众叛亲离,清理门户的残酷阶段。

当公司人去楼空,他一个人抱着电脑,进入了前女友的Facebook页面,发出加好友的邀请。

接着,重复按F5,刷新,刷新,刷新……

电影就在这机械性的动作中结束。

他成功了吗?

显然。

他失败了吗?

当然。

但正是无数成与败碰撞出的火光,才让一个“人”的轮廓,越加清晰。

本文图片来自网络

图灵测试20:怎么判断AI到底能干什么不能干什么

在计算机领域,图灵测试可是大名鼎鼎,但如果用在AI上,就没那么简单了。本文进行了一次测试,抽取了真实产品的部分场景进行方便理解的再包装,目的主要用于说明图灵测试2.0这概念。

图灵测试本身是一个定性的、概念性的测试,理论上随便哪个程序都可以通过缩窄测试范围、限定测试集然后通过所谓的图灵测试。

换成产品视角,情况则有所不同,这时候能否通过图灵测试就会限定在产品的边界以内,并且拳拳到肉,一旦不灵,AI驱动的产品就不成立了 。本次测试就是抽取了真实产品的部分场景进行方便理解的再包装,目的主要用于说明图灵测试2.0这概念。

考虑潜在的误读,预先做如下声明:

1. 本测试不权威也不全面,但可复现,过程数据有留存。可复现是指按照步骤每个人都可以测试。

2. 本测试不代表各个模型优劣,只代表和设定场景的匹配度。

3. 本测试选择模型有主观性,在用的起和好用上做了权衡。

一、角色中心式计算与图灵测试2.0

角色中心式计算是相对功能中心式计算说的。

到现在为止差不多所有我们用的APP是以功能来划分的,职能相对单一,比如IM、搜索、外卖、打车等等。

一个角色职责的完成往往需要组合很多的功能,比如那怕一个招聘的角色它背后都必须组合十几个工具(从IM到招聘APP等)才能完成招聘某个人的工作。

现在AI可以承担这个居中调度的角色,所以应用的下一步必然是角色中心式计算。

而角色中心式计算是否成立,核心则在于AI的智商程度是否能够处理角色边界内的一切事情,比如招聘的时候要能判断当前的JD的描述是否匹配需求方的需求也要判断一个候选人是否初步匹配对应的招聘需求等。

如果角色的每一个这种关键步骤的都可以用AI来完成,那对这个角色而言就不单通过对话无法区分出这是真人还是AI,从现实的反馈也无法区分。

这就算通过了图灵测试2.0。

这点之前展开比较多,这里不过多重复了。

在过去的文章里一直缺一个往下一步,怎么设计和实现图灵测试2.0的例子,这篇文章重点在这里。

我们抽取一个真实场景的核心步骤,从易懂的角度包装成一个极简的例子,来说明图灵测试2.0的概念怎么分解,和一个具体的角色怎么融合。

二、图灵测试2.0的示例

假如我们打造这么一个简单角色。

它是你的代理,可以帮助你按照你的设定在特定UGC平台上发布你生成的内容。(OpenAI发布会上Greg Brockman演示过类似的例子)

我们略去大量细节来描述这个角色。

这样一来这个角色就有4个关键内涵

1. 完成你对自己做的人设。

2. 针对特定话题或者问题生成内容。

3. 确保内容的质量。

4. 发布等执行步骤。

第四步的发布等是传统的RPA等技术,其实并不关键,后面就都略过了。

在这三个关键步骤里面,除了内容生成,还需要AI做的判断是:

1. 生成的内容是不是真的匹配对应的话题或者问题?(内容生成是一次性的,在多个平台发布是多次性的,所以要经常做匹配的判断)

2. 内容的基础质量到底怎么样?

这两项工作别看简单,但在没有AI大模型前还真的很难做好。在过去你就没办法针对特定问题、话题实时生成内容,也很难实时大批量的判断匹配度。

有点像无机物到单细胞生物。

为了缩减文章篇幅,我们进一步降低目标。

完成第一项工作就变成生成一个内容的概要,然后大模型判断内容概要和问题的匹配度。 这里其实可以直接用模型,也可以用Embedding算法。

两者各有利弊,但这里只关注用模型的判断结果。

这步骤做完之后,比如你生成的内容是:青玉案元夕相关,那就可以匹配到古诗词的标签或者特定问题下面。

都测试完了之后,还需要用人来标注下最终测试结果,这样就提供个绝对的尺度,知道AI大模型算法能进行到什么程度了。

第二项的评测简化成使用BLEU算法来评测生成内容的相似度。

这是避免内容生成的重复。

为什么做这个呢?因为最终不希望反复发表一样的内容。即使输入相对一致,比如人设、话题等有相似性,也不希望内容一致。

至于是不是内容生成的足够优美,就先不管了,那十分麻烦。

为了完成这个测试,需要一些真实数据,这可以手动编辑或者抓取 。这部分和具体你辐射的领域有关系,文艺青年、斜杠青年等需要的数据不怎么一样。但这和RPA一样是个传统的活,大部分程序员都会做。这里为了避免不必要的麻烦,数据先不公开了。

完成了上面的工作,其实就完成了从一个角色到图灵2.0测试集的基础映射:关键是要分解角色内涵,为关键判断建立测试集。

三、测试结果

在准备的1000条测试数据上,第一项测试最终结果是下面这样:

这里面检出率是指在1000条测试项目里,有多少模型判断为匹配的,准确率是指在认为匹配的项目里面和人的标注比,准确率什么样。

这个测试结果最终怎么用会和你的倾向性相关,显然的数量优先和质量优先结果是不一样的。

结果里面最有意思的点是:至少在这一个判断项上,AI还不如人。所以如果判断项比较多,整体精度的控制会是很有挑战的问题。

然后我们测试的是内容生成部分的质量,这部分我们不测文辞是否优美这些,就测生成内容的最简单的BLEU值,其中参数都用缺省参数,temperature这些就不改了。如果做的很细,这部分可以反复试多组值。但我们是为了说明图灵测试2.0概念,就不做这部分了。

最终测试结果中得分前三的是:

全部模型的测试结果是:

这里面和原文对比是指创作内容和原始种子做比较,然后统计BLEU值小于0.75的比例,0.85就意味着85%的内容差异度大于0.75。(原文可以看成是内容的种子,基于原文和提示词生成对应内容。)

和改写结果比是指,同样的方法会生成3次内容,然后看BLEU值,把小于0.75的除以3就是上面的结果。当然提示词中会包含加大差异度的部分。

内容生成会比较耗费token,所以同步要记录下token数目和费用。最终出了个价格离谱的,说明模型初选的时候选错了。

四、例子的意义

当这种测试可以通过,那就意味着最终从技术视角看,对应的角色可以通过图灵测试2.0。如果精度达不到一定程度,那你设定的角色在当前AI的智商下就不成立。不管多酷炫、别人多么吹捧但对解决你设想的问题都没意义。

其次是要理解,任何一个角色的成立要涵盖对应角色的N多方面。

用AI来做亮眼的Demo,和用AI做真正能用的产品,两者的难度不在一个数量级,虽然看着都是差不多的东西。这就是一般镜头和哈勃望远镜的镜头的区别。

这种测试结果也可以标识从产品角度看到的AI的真实进展。往往和某些媒体上来的认知有很大偏差。

落地时里面的项目和复杂度当然需要进一步增加。

但如果真想用AI,那现在开始就需要建立你自己的测试集,并且在模型还不稳定的时候定期测试。

假设这个测试集里面的数据采样足够丰富,再加上一个对接到各个大模型的测试框架,那在你的领域你会比任何人都权威,不用听任何人的。

这就是之前说的一手体验

这里面对一般人有点挑战的倒不是提示词怎么写,这部分资料比较多,反复测试可以找到解决方案,最不济还可以问AI。

麻烦一点的是怎么组合各种算法。

不是所有的时候都只用大模型一种算法就行的。

这部分只能陆续探讨,没有唯一解决方法。

限制

上述方法现在可以用于支持一些比较简单的角色。

但因为角色自身的行为模式还是基于规则,只能在限定的流程框架里面完成任务。

如果角色过于复杂,可能还需要进一步的AI进步,暂时可以先别整。

但这已经能够打造一些和过去不一样的应用了。

五、小结

最终再总结下图灵测试2.0的全过程:先定义你认为有商业价值的角色,然后依据角色挖掘它的内涵,具体成相应的图灵测试2.0的测试集,然后就反复测试各种模型。 如果能通过,那从技术角度角色也成立,产品可以启动。否则就得等等。回到现场的一手体验,是AI产品的最最关键的起点。

专栏作家

琢磨事,微信公众号:琢磨事,人人都是产品经理专栏作家。声智科技副总裁。著有《终极复制:人工智能将如何推动社会巨变》、《完美软件开发:方法与逻辑》、《互联网+时代的7个引爆点》等书。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

相关问答

华为、中兴、信科、诺基亚四家,谁家的光传输比较先进?

先来看一下年度全球光通信最具竞争力企业。全球光纤光缆、全球光传输与网络接入设备、全球光器件与辅助设备、中国光纤光缆、中国光传输与网络接入设备、中国光器...

短视频+电商,这是社交平台的下一个风口吗?

与其说短视频+电商是社交平台的下一个风口,还不如说是电商的下一个风口是sns社会化营销。那么sns营销会走向何方呢?今天亿恩网就给大家带来了2019年跨境社交媒...

如何评价现在的光线追踪技术?

我们的2018年已经过去,说漫长却难以伸手抓住、说短暂却巴不得早点脱身的2018年被我们抛在身后似乎仅仅是一瞬间的事情,所以是时候给今年的市场发展寻找关键词。...

求推荐以一战,二战为背景的电影?

十部二战经典电影推荐,中国仅一部,军迷不看绝对后悔10、《白色虎式》称之为战争电影略微有点勉强,其人物场面道具都不值得称道,而节奏缓慢画面灰白,倒是这...4...

怎么评价82版《银翼杀手》?

“我所关心的主要问题是:何谓真实?我甚至质疑这个宇宙,我想知道是否它是真实的,我想知道是否我们都是真实的!”菲利普·迪克在他的著作中这样发问。人?该...《...

如何评价NVIDIA RTX 2080 Ti显卡?

大家期待了两年的NVIDIA新显卡,终于在今天正式解禁了性能评测,中间跳过了Votla架构后,Turing架构横空出世,带着图灵极具革命性的创新思想,全球第一款支持实...还...

当前有哪些趣味的多屏智能机设计?

图灵太空工业(TuringSpaceIndustries)刚刚发布了一款次世代概念智能机,它就是配备了多块屏幕、采用两颗移动处理器、并且支持5G网络连接的HubblePhone。...

显卡1060好还是1650好-ZOL问答

镜头图丽图丽AF16-50mmf/2.8讨论回答(8)选择显卡主要取决于您的需求和预...但是GTX1660选用了全新升级的图灵架构,有着更优秀12NM加工工艺制程,在功能损...

《爱情公寓》里有哪些细思恐极的地方?

同样是《爱情公寓5》系列,为什么差别这么大《爱情公寓5》开播热度不俗,意外捧红平面模特诸葛大力,观众看完后觉得这已经不是以前的喜剧了,而很多的是表现了...

如何评价《记忆大师》?

可以毫不夸张的说,陈正道和任鹏弥补了内地电影,有关悬疑+科幻类型片的空白。不光填充了这一长期的缝隙,而且他们玩儿的还很好。提起悬疑,影迷最容易想到的...