您的位置: 山西信息港 > 时尚

数据造假成点评类网站潜规则数据造假是初创

发布时间:2019-03-22 14:55:27

导读:在现代社会信息化浪潮中,信息、数据成为推动社会进步的重要力量,大数据以及相应应用技术尤为重要,已经成为市场经营者掌握竞争优势的重要因素。法律制度对于大数据信息所蕴藏巨大商业价值的保护与规制,应秉持保障交易安全、促进技术发展、尊重诚实信用以及公认商业道德的基本思路

日前,旅行平台马蜂窝被曝数据造假,2100万条点评中有85%以上是从竞争对手站抄袭来的。不论马蜂窝如何义正言辞地表示 文中所述数量与事实不符 ,但马蜂窝平台上的确存在数据造假问题,这是毋庸置疑的。

业内人士表示,数据造假问题,包括刷单、刷量、刷分、搬运原创内容等,已成为行业的大问题,也是目前许多点评类站的 潜规则 。北青报了解到,这些数据造假成本低廉,2元即可买1万视频点击,或3毛钱购买到一条微博评论。与此同时,追责的成本非常高,此前有视频站起诉刷量公司,9.5亿次的造假换来50万元的赔偿。

马蜂窝承认数据造假行为

此前,乎睿数据提供的数据显示,马蜂窝的海量点评中85%以上来源于竞争对手站,马蜂窝的2100万条 真实点评 中1800万来自于抓取其他站。马蜂窝上有7454个抄袭账号,合计从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了572万条餐饮点评与1221万条酒店点评。

而马蜂窝在回应中先是承认了数据造假的问题,其次表示没有文中所述的那么多。 点评内容在马蜂窝数据量中仅占比2.91%,涉嫌虚假点评的账号数量占比更小,马蜂窝已对这部分账号进行清理。

但这样的说法又被对方指出 偷换概念 。 这个 数据量 是条数还是数据大小?如果这2100万 真实点评 占的是条数的2.91%,那反推马蜂窝的游记、攻略有7亿条?明显不是。如果这2100万 真实点评 占的是数据大小的2.91%,那这个比较有什么意义?一条点评100字,大小只有几百字节,但游记里一张图片就好几MB。一篇游记的数据量可能是一篇点评的几万倍,拿点评的数据量只占2.91% 来说点评不重要? 对方还罗列了马蜂窝在首页显示 2100万条 真实点评的宣传,来说明点评对马蜂窝的重要性。

几天后,在马蜂窝召开的新品发布会上,其CEO也当场承认,数据造假问题是存在的,只是文中所述内容与事实不符。有业内人士表示,数据造假问题已经是业内的一种 潜规则 ,有人的地方几乎就有数据造假的问题,而目前不论是行业还是个体,都很少对该问题进行重视和追责,也就使得数据造假进一步成为一种 潜规则 。

为何刷单?数据造假是初创公司 捷径

据业内人士介绍,在数据造假上,有两种造假的需求主体,一是商家,二是平台。对商家来说,在具有影响力的平台刷单、刷量,可以提升商家的排名和影响力,更多的好评和更靠前的影响力会影响消费者的消费决定,从而为自己赢得更多的生意。因此,在许多电商站上,甚至许多线下的营销公司等都纷纷做起了代理生意,指导商家如何通过各种途径,包括刷单、促销、刷评价等方式,为自己带来利益。

一位餐饮店铺的老板对北青报表示,自己新开了店铺,因为知名度和地理位置的关系,流量一直不大。 现在许多消费者都依靠络平台寻找店铺,因此我们很重视这块。找了专门的营销公司帮着做,他们先帮我们提升店内的浏览量和点击率,然后再提升交易量和好评数,很有一套。假的带真的嘛,现在店里客人真的比之前多了很多,我觉得很值。

而对平台来说,为何对许多商家刷评论或刷单的行为 睁一只眼闭一只眼 ,甚至平台自己也会偷偷去刷呢?因为对许多内容平台来说,数据就是生命,只有平台整体保持有足够多、足够优质的评价,消费者才会形成一种使用习惯,真是消费者打开次数多了、消费次数多了,就会带来更多的消费与评价。另一方面,是融资的需要。拿给投资人一份好看的数据,是每个初创公司的共同追求,短期内提升数据很难?数据造假可能是一条 捷径 。

此前有平台被发现大规模搬运其他平台的评价,该平台承认了存在店铺违规转载的情况,并表示: 该事件发生是因为平台新上线试运营的推荐栏目,在未经授权的情况下对相关内容进行了违规转载。 平台新栏目上线,没有评价怎么办?转载其他平台的,这也是很多评价类平台都存在的问题。

刷单成本低至2元起

北青报调查发现,这种机械的刷单价格十分低廉,由于刷单、刷量、刷评论等相关技术已经很成熟,因此造假的成本其实非常低。

例如在微博平台,一家专门做微博营销的公司开出的价格是5元起, 微博转发,点赞,微博投票,价格分别如下:首次体验价5元100个,100=10元,1000=80元,1万=600元;评论:30元=100个(注:指定一条微博至少100次起刷,不够100按100算)。去别人微博底下评论的赞,30元100个,微博阅读量10元1万,80元10万;视频播放量20元1万。 这家公司同时帮助用户增加粉丝,粉丝还分为初级、高级、精品和几类: 高级、初级都是凑数的哦(就数量没质量),高级是有头像,初级就数量什么都没有;、精品是真人,有自带粉丝跟博文的。 据透露,

数据造假成点评类网站潜规则数据造假是初创

许多和精品的账号都来源于盗取真实用户的账号,攻陷后,这些此前被精心维护的账号就成了别人手中的 武器 。

而为视频站的作品刷量,报价2元起。据一家营销工作室负责人介绍,目前所有的视频站包括优酷土豆、腾讯、爱奇艺、搜狐、乐视、PPTV等都可以操作 刷量 ,价格不等。其中,爱奇艺的分为两档,一档为 掉量的 ,也就是以机器刷量,这种方式容易被爱奇艺以技术手段发现并屏蔽,10元1万次,7天内包补;另一档为 不掉量的 ,价格为80元1万次,不过该档 不保证速度,需要排队,数据延迟更新,不接急单 。另外几家视频站的刷量报价从2元1万到60元1万不等,有的承诺 掉量补 ,有的则保证 快速 。一些刷量的商户显示月销近5000笔,由此获得的不法收益也较为可观。此前,爱奇艺就起诉了一家 刷量 的公司,并被判获赔50万元。

另外,蜻蜓FM的CEO在宣布用户数1.5亿的两个月之后就宣布用户数突破2亿,也就是说两个月之内涨了5000万用户,不少业内人士纷纷表示数据一定有问题,而数据造假的目的应该是增加广告收入和促进融资。虽然蜻蜓FM回应这些软件是新功能上线时进行AB对照测试、统计相关用户指标,以便产品决策的技术框架,但依然无法解释为何会增加广告点击量和日活数。

平台也会主动抓取内容

而平台自己也会利用 爬虫 等技术手段抓取用户信息或评论。据一位工程师向北青报介绍,一些站可以利用 络爬虫 来抓取, 爬虫 就是将正常人可以浏览的内容,用公开的查询接口读取出来,再归纳成文档。由于评价的内容是公开的,因此很容易被 爬虫 抓取,一些站不仅抓取评价内容,连注册用户的内容也完全照搬。

例如,小红书就曾被一站批量侵权。多位小红书用户称,自己在小红书上的原创内容遭到点评 达人 栏目的搬运,将自己的账号、头像和图片内容都搬运到点评上。 前几天朋友告诉我在点评上看到跟我的小红书账号一模一样的名字、头像、笔记内容,甚至是视频(我在此之前毫不知情)。和几个小红书的小伙伴私下聊一下,发现点评上出现的一堆 达人 账号,都是批量操作批量盗用小红书的博主账号。 点评回应称,经调查,该事件发生是因为点评新上线试运营的推荐栏目在未经授权的情况下对相关内容进行了违规转载,已时间完成所有内容排查与全部清理下线,并通过技术手段确保该类问题不再出现。

百度此前也曾遭遇类似问题。百度公司未经许可在百度地图和百度知道中大量使用了来自大众点评的信息,在百度地图和百度知道产品中搜索某一商户,页面会显示用户对该商户的评价信息,其中大部分信息都来自于大众点评。后者将之诉诸法院,法院调查发现,由百度地图公证抽取的商户点评信息资料,其中涉及餐饮行业的1055个商户共使用来自于大众点评的评论信息86286条,平均每家商户使用81条。有784家商户使用的评论信息中超过75%的比例来自大众点评,且所有评论信息均全文显示并主要位于页面前列。因此,百度被判赔偿后者300万元的损失。

法律规定刷单刷量者要承担

事实上,刷量行为不仅会降低站或商户的信用,更会造成不公平竞争。上述案例中不少平台或公司都由此被告上了法院,终被法院判处赔偿。不过,为何还有大量的刷单、刷量行为呢?据一营销公司介绍,一是由于商家刷量的同时,也会为平台增加活跃度,因此很多平台睁一只眼闭一只眼,不会进行举报;二是举证难,许多营销公司刷量时会利用人工、技术等多种手段,伪装成真实评价,不易被发觉,更不易被取证;三是维权成本高,走司法途径等需要花费一定的时间成本和经济成本,而且终被赔偿的金额也不高,例如爱奇艺被刷量9.5亿次,终仅被赔偿50万元。

不过上海徐汇法院知识产权审判庭庭长王利民则认为,应当维权。他说,在现代社会信息化浪潮中,信息、数据成为推动社会进步的重要力量,大数据以及相应应用技术尤为重要,已经成为市场经营者掌握竞争优势的重要因素。法律制度对于大数据信息所蕴藏巨大商业价值的保护与规制,应秉持保障交易安全、促进技术发展、尊重诚实信用以及公认商业道德的基本思路,刷量的行为会损害视频站的商业利益,也会损害消费者的合法权益,应承担相应侵权。

猜你会喜欢的
猜你会喜欢的