豆瓣挨了用户的「板子」,冤吗?

如何评价《流浪地球》豆瓣评分从 8.5 分掉到 7.9 分?
图片:geralt / CC0 若何评价《流离地球》豆瓣评分从 8.5 分失落到 7.9 分? chenqin,数据帝

截止到今天,《流离地球》总票房已经冲破 40 亿,当作为中国影史票房第二的作品。与此同时,流离地球在豆瓣上的评分也从 8.5 下降到 7.9,两者的背离激发的会商,其热度完全不亚于《流离地球》内容自己的会商。

但事实上,这个下跌,从 8.5 到此刻的 7.9,或许并没有什么特别的。正如以下两个谜底所说:

若何评价流离地球豆瓣片子评分跌破分若何评价流离地球豆瓣片子评分跌破分

1,很多片子上映后都呈现了豆瓣分数逐渐下跌的现象。四部春节档片子,分数下跌也都不比《流离地球》少。而按照 @惊记 抓取的豆瓣数据,在 2018 年的片子里,《唐人街探案 2》、《超人总带动 2》、《李茶的姑妈》、《神奇动物:格林德沃之罪》、《无敌粉碎王 2:大闹互联网》,都在上映一周内分数下降 0.5。更别说我最喜好的《海王》了,人家从 8.5 下降到了 7.7,嘤嘤嘤(奉求可别在本谜底下刷海王真难看的评论了)。

2,《流离地球》的分数下降,和其他分数下降的片子一样,本家儿如果由三星和四星的比例上升导致的。一星比例高达 2%,而固然偏离划一片子的正常程度,却对总分影响甚小。如下图所示,在当前的分数布局下,即使把 2%的一星全数扔失落,平均分也只能增添 0.1 分。

事实上,豆瓣的报复者并不是对这些数字全无所闻。一起头,他们说豆瓣分数下跌不正常;过几天,他们认可分数下跌幅度或许正常,但一星比例高得不正常;再到后来,发现 2%的一星比例对总分影响不大,但又认为豆瓣热评首页里差评太多……

总之,这个板子,是必然要打到豆瓣身上去了。

【已经花了 300 块钱采办了 3 张 IMAX 影票带全家去不雅看了《流离地球》的】我感觉,因为对网站的评价不对劲,就把板子打在豆瓣这个 app 身上,似乎也有些莫名其妙。究竟结果一星的评分是用户本身去打的。热评首页中差评排序居多,那几万票「有效」也是用户本身投上去的。

好比豆瓣到此刻还排名第一的左丘掉明的长评——

人家确实有 5.6 万个踩,但也有 4 万多个赞,这不是一个小数字吧?

再好比对《流离地球》的短评。上图是热评的前三名,第二和第三名都打了一星,加起来有 10 万个赞。此中排名第二的「嘟嘟熊之父」,此刻有 6.5 万个赞,比一礼拜前增添了 4 万多个。

而《流离地球》的一星评价数目,在同期只增添了 1.5 万个。

对「嘟嘟熊之父」的一星短评的附和增量,远远多于现实的一星评价的增量。这意味着什么?

这意味着——良多人确实没有颁发评论,也没有给《流离地球》打一星,也许是因为打一星会显示在页面上。他们只是静暗暗地找到合适本身设法的评论,然后点了一个不克不及被别人看到的赞。

这让我想到 2016 年的美国总统大选,公共场所下大师都不喜好特朗普,所有的平易近调都不看好特朗普,媒体也说特朗普这欠好那欠好,看上去希拉里民气所标的目的……

然后特朗普赢了。

在大选时,因为不喜好一小我而选择别的一小我是常见的现象,但对片子来说,不存在直接的否决机制。我不喜好看这个片子,也没法卖空,也不会拼命去看另一部片子,这没意义。所以如果不喜好一部片子,除了评论和在软件上打分,其他也啥都做不了。

是以,疆场才汇聚到了豆瓣身上。

但正如希拉里败选后没法去怪罪大选轨制一样,因为豆瓣上的差评在首页排名很高就去怪罪豆瓣的话,还不如去想一下,那些让你们看不顺眼的一星差评,为啥会拿到 6.5 万个、4 万个、3 万个【有效】

把这几万个点赞全数当当作【牧羊犬】【跪久了】,说几句【尔曹身与名俱灭】之类的标致话,对理解这个问题,有帮忙吗?

短评第一名是 5.6 万个【爱国者】,短评第二名是 6.5 万只【牧羊犬】,很让人欢快吗?

这篇文章从这里才真正起头。我们想要研究的一个问题是——豆瓣的用户,和真正去看片子的用户,事实有什么纷歧样?为什么会纷歧样?这样的差别会造当作什么?

起首,我们给每一部片子做一个用户画像。

片子的用户画像并欠好做,起首,在线购票的比例固然到了九当作,但并不知道这些票都是给谁买的。其次,对在线购票者本人来说,他们的画像也纷歧心猿意马精确。

是以,我们利用生齿普查分区县数据和各区县的票房和人次数据来完当作这个画像,步调如下:

1,片子

的总不雅影人次为

,此中在区县

的不雅影人次为

2,

,暗示每一个片子

在分歧区县

的不雅影比例。

3,

暗示昔时区县

的不雅影总人次,用每个区县的不雅影总人次除以昔时全国不雅影人次

,获得

,暗示昔时所有全国不雅影人次中分歧区县

的不雅影比例。

4,

,暗示区县

在片子

中的不雅影比例大于区县

在所有片子中的不雅影比例的水平,可以理解为,是区县

5,对于每一个片子

,回归该式:

,获得一组

。他的寄义是,我们要用每一个区县的特征,去诠释为何分歧的区县会对这部片子有纷歧样的「偏心」水平。

举一个例子,此刻有 100 小我,50 个汉子 50 个女人,本年总共看了 30 次片子,汉子看了 15 次,女人看了 15 次。

此中有一部片子叫做《刺激的动作片》,汉子看了 10 次,女人看了 5 次。那么

从上式我们发现,当性别从女性酿成男性的时辰,对《刺激的动作片》的偏心水平从

上升到

,带来了一个效应为

的上升。是以有:

这样,就把性别对《刺激的动作片》的偏好影响估算出来了。我们对每个片子都做如斯回归,半斤八两于是把 3000 多个区市县算作 3000 个具有分歧特征的人,经由过程这 3000 个「人」的分歧特征和对片子的分歧偏好,把所有生齿特征对所有片子的偏好给算出来。

6,利用性别比例、平均教育水平和春秋布局三个特征,我们回归计较了所有片子,记实下所有系数,这样每个片子城市酿成一个三维的标的目的量。好比《复仇者联盟》,我们就有三个数值:

对所有的片子,我们都有这三个数值。前 20 名的片子的系数表格如下:

拔取 2012 到 2018 年所有不雅影人次在 1000 万以上的片子,将三个数值别离作为一个三维空间的 x、y 和 z 轴作图,可得下图:

在上面的三维坐标中,大于零的部门暗示性别越偏男性 / 教育越高 / 春秋越小 越偏好于这部片子。用不雅影人次排名前 20 的片子举例,具体表格如下:

这个算法准禁绝呢?我们可以做一个查验,看每一个点的比来的邻人别离是谁——两个在三维空间里距离较短的点,申明两者的不雅影人群十分近似。我们尝试了四部分歧类型的片子,别离找到离这四部片子比来的 5 个点,成果如下:

可以看到,在空间上最接近的几个影片有不异的不雅众偏好,一般也处在统一个范围内。好比到《复仇者联盟 2》距离比来的 5 部片子,有 4 部是漫威出品;在距离《熊出没·变形记》比来的 5 部片子中,有 4 部都是熊出没的系列片。

从直觉上看,这个算法仍是能很是精确地将片子给划分隔来的。

出格有趣的是《战狼 2》,距离他比来的五个点别离是——

1,小时代 3:刺金时代

2,小时代 4:魂灵绝顶

3,佳丽鱼

4,捉妖记

5,小时代:青木时代。

这申明《战狼 2》的不雅影人群画像,和《小时代》系列是十分近似的。出格让人惊奇的是,和我们的印象分歧,《小时代》的性别系数和《战狼 2》一样,都是正的,申明男性越多的地域,反而越偏好《小时代》。

并且我们可以看到一个现象——和战狼 2 最接近的几部片子,都缔造了票房佳绩。

每一部小时代都是昔时票房的佼佼者,到了《佳丽鱼》和《捉妖记》,这个偏好的不雅世人群缔造了昔时的票房冠军,更别提《战狼 2》了,他缔造了中国影史票房冠军。

这个现象也提出了本文的第二个问题——我们应该拍摄什么样的影片,吸引什么画像的人群,才能尽可能吸引更多不雅众来不雅影?

我们将性别、教育和春秋这三个指标别离和不雅影人次的对数作图,可以获得下面三张图:

从上面三张图中,我们可以看到:

1,过于方向某一种性此外片子,不会有很好的票房,只有性别处在中心的时辰,票房才更高。

2,让春秋太低或者春秋太高的人出格喜好的片子,票房也不会很高,也需要针对中心值来确定不雅众的偏好。

3,和性别、春秋的图中呈现的先上升、再下降的图分歧,教育程度的偏好关系和不雅影人次似乎并没有一个较着的峰值,而是跟着教育晋升,单调下降——越让高教育生齿喜好的片子,票房越低

我们将上面的第三张图分当作 2015、2016、2017 和 2018 年,可以看到一个更较着的趋向——

上面四条线的斜率,一年比一年大,这意味着低教育偏好的片子,带来的不雅影人次一年比一年高。

2015 年和 2016 年时,低教育偏好的片子和高教育偏好的片子,在不雅影人次上还差不多,从 2017 年起头两者的关系变为显著负相关,系数为 -0.17,在 5%程度上显著。

2018 年,低教育偏好能带来更高票房,系数已经达到 -0.22,在 1%程度上显著。

这意味着片子的方针不雅众教育程度越低,该片子的票房越高,并且两者的相关水平还在不竭上升。

为什么会这样?谜底很是简单——高教育生齿,已经不克不及进献增量票房了

我们将中国 3000 多个区市县按照其平均教育程度分为四个部门,别离是平均教育年限大于 12 年(全国前百分之 1%程度)、10.9 年到 12 年之间(全国前 1%到全国前 10%)、9.6 年到 10.9 年之间(全国前 10%到全国前 25%)、9.6 年以下(全国后 75%程度),他们在 2012 到 2018 年的不雅影人次如下图所示:

从上图可以看到,在教育程度最高的地域,不雅影人次从 2015 年到 2018 年已经下降了 6%!

教育程度次高的地域也有同样的现象,从 2015 到 2018 年只上升了 5%。

而平均教育年限在 9.6 年以下的地域,从 2015 到 2018 年的不雅影人次上升了 55%

跟着中国的片子院在发财地域饱和,并标的目的三四线城市舒展,将来若是有人可以或许对片子票房发生新的进献,那么他们必然是三四线城市的人群。

是以,新的卖座片子,必然是为这批不雅众量身心猿意马做的片子。

回到一起头的问题——为什么会很多片子的豆瓣片子评分逐渐降低?那些豆瓣评分逐渐降低的片子,和片子自己的方针人群特征有什么关系?

我们将 @惊记 供给的豆瓣分数动态转变数据和我们用票房数据计较出的每一部片子的偏好链接在一路,看哪一个维度的指标和豆瓣的评分降低有关。

成果,只有一个指标有显著相关性,他就是一部片子方针人群的教育程度和片子偏好的系数。

上图是豆瓣评分和片子倾标的目的不雅众的教育年限之间的关系。可以看到,越倾标的目的于高教育地域的片子,在豆瓣上都有越高的评分。

上图是豆瓣开分和十天后的评分差额与片子倾标的目的不雅众的教育年限之间的关系。散点图的相关性在 1%的程度上显著,申明片子的方针不雅世人群越倾标的目的于低教育生齿,豆瓣给他的评分下降就越多。

此中,位置在最上方,分数提高最多的片子是《无问西东》,豆瓣开画 6.7 分,到第十天是 7.7 分(今朝是 7.5 分),票房为 7.5 亿。

而分数降低最多的是《后来的我们》,豆瓣分数从一起头的 7.1,降低到第十天的 5.9(今朝仍为 5.9),票房为 13.6 亿。

最后理顺所有的故事:

1,从 2015 年起头,那些比力发财、平均教育程度比力高的地域,不雅影人次达到饱和,呈现增加障碍,甚至下降。而那些欠发财、平均程度比力低的地域,不雅影人次持续增加。

2,欠发财地域生齿偏好度更高的片子,可以或许带来更高的票房,且两者关系逐年增添。而豆瓣对这批欠发财地域偏好的片子更为苛刻,他们固然经常拿到很高的票房,可是豆瓣评分却往往逐渐降低。

3,片子的供给者当然会优先知足快速需求的增加。在这种趋向下,我们将来将看到更多为这批快速增加的欠发财地域不雅影人群量身打造的片子。

4,除非豆瓣的组成和中国不雅影人群的组成一样快速改变,不然,跟着片子供给标的目的欠发财地域的偏好逐渐倾斜,豆瓣评分走低但票房又同时走高的现象,将会越来越频仍地呈现。

注:

感激 @王义之 供给的片子票房分影院的日度数据以及 @惊记供给的从 2017 年起头的豆瓣评分动态数据,其他数据来自第六次生齿普查分县资料。因为还没有拿到《流离地球》的分影院数据,我们临时难以估计出《流离地球》的偏好坐标。

  • 发表于 2019-02-24 19:49
  • 阅读 ( 780 )
  • 分类:其他类型

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
admin
admin

0 篇文章

作家榜 »

  1. xiaonan123 189 文章
  2. 汤依妹儿 97 文章
  3. luogf229 46 文章
  4. jy02406749 45 文章
  5. 小凡 34 文章
  6. Daisy萌 32 文章
  7. 我的QQ3117863681 24 文章
  8. 华志健 23 文章

联系我们:uytrv@hotmail.com 问答工具