10月20日晚间,一篇“小声比比”微信公众号发布的文章《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》引发行业关注,阅读量迅速10万+,文中直指“旅游独角兽”马蜂窝旅行网存在抄袭和评论造假。马蜂窝有关负责人今日下午对新京报记者表示,正在梳理、组织证据,随后会进行公开回应。
乎睿数据:马蜂窝85%的“真实点评”来自抄袭
《 估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》基于乎睿数据的提供的数据分析,认为马蜂窝2100万条评论的“真实评论”中有1800万条是从携程、美团等其他网站抄袭而来。
图/网站截图
图/乎睿数据
除了罗列详细的抄袭证据,乎睿数据提取的15000个账号还具有惊人的同一特征:同时活跃、同时平淡,餐饮和酒店点评在周中即工作时间更加活跃,在周末却断崖式下跌,这与其他点评网站恰好相反。
图/乎睿数据
《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》指出,马蜂窝不仅抄袭、抓取其他网站的点评,还有员工专门对这些点评进行编辑加工。
2014年4月,马蜂窝CEO陈罡曾经在微博公开炮轰去哪儿网通过虚假评论造假,称去哪儿网的刷点评行为已经动摇到了行业诚信的根基。
图/微博截图
马蜂窝在2017年年底融资时称,社区目前拥有 1.2 亿用户,月均活跃用户数达 1 亿,其中 85% 来自移动端。此次提取的用户数量能否说明1.2亿用户的情况还不得而知。对于马蜂窝更为核心的旅游攻略,乎睿数据称还会有分析继续放出。
根据天眼查的信息显示,深圳市乎睿数据有限公司是一家2018年1月11日注册的公司,注册资本为102万,“乎睿”商标在2018年5月注册,新京报记者进行搜索后尚未发现有其他数据分析报告发布。
从旅游社交平台转型为自由行交易平台
马蜂窝旅行网是以内容起家的旅游平台,专注于“全球旅游消费指南”,走的是一条与传统OTA不同的运营模式。从旅游社区起步的马蜂窝,自2015年发布自由行战略以来,探索出了一条从内容到数据再到交易的商业模式。可以说,内容尤其是游记、点评是马蜂窝“发迹”和得到投资人青睐的重要基础。
2011 年 10 月,当时还名为“蚂蜂窝旅行网”的马蜂窝获得今日资本 500 万美元 A 轮投资(马蜂窝2017年从“蚂蜂窝”改名为“马蜂窝”)。2013 年 4 月,获得启明创投和今日资本 1500 万美元 B 轮投资,当时称此轮资金用于商业模式创新,以及移动互联网产品和服务的开发与应用布局。2015 年 1 月,获 C 轮融资,投资方为高瓴资本、Coatue、CoBuilder、启明创投。2017年12月,马蜂窝时隔两年零九个月后完成 D 轮融资,融资金额为 1.33 亿美元,马蜂窝CEO陈罡在D轮融资的内部信里表示,“三年后,蚂蜂窝将成为中国最大的旅游流量平台”。
即便在红利期,在线旅游攻略社区也曾被迅速挤成一片红海。先后有在路上、面包旅行、蝉游记等纷纷入局,还有巨头如携程,旗下也成立了独立的攻略社区事业部。
在用户旅游计划的决策环节,旅游社区和旅游资讯等网站处于明显的上游位置。用户通常都是受到亲朋好友或者各类媒体、旅游资讯的影响,确定旅游目的地,再制定旅行计划,继而预订机票和酒店。但UGC(用户原创内容)却是离交易环节较远的一部分,变现、盈利成为旅游社交平台继续生存的难题。但随着资本逐渐变冷,在线旅游攻略社区的进入热度在遭遇UGC的“变现”难题后,也开始降温。
大约从2014年开始,以马蜂窝为代表的旅游社交平台开始进入商业化探索的转型期。先是2014年初,马蜂窝创始人陈罡在年会上宣布公司将要变成一个大数据公司,利用已经沉淀的点评、攻略等信息通过技术手段的分析,帮助用户做好旅游决策。
2015年,在转型大数据公司的基础上,马蜂窝进一步升级为一家做自由行的交易平台,并将APP更名为“蚂蜂窝自由行”。自此,曾一路领先的穷游在向电子商务的转型阶段,被马蜂窝赶超。曾有分析指出,相较于穷游,马蜂窝近年来的商业转型显然是更为成功的。
花重金进行品牌营销,世界杯广告耗资1亿多元
马蜂窝在商业化方面的探索成效也得到了资本市场的认可。2017年12月,马蜂窝获得了来自美国泛大西洋资本集团、淡马锡等机构投资的1.33亿美元。此后,马蜂窝也进一步加快了转型步伐。今年2月5日,马蜂窝宣布“蚂蜂窝旅行网”再次更名为“马蜂窝旅游网”,并启动了新一轮品牌换新升级。
今年8月17日,据外媒报道,有知情人士透露,马蜂窝正在着手新一拨融资,目标筹集至多3亿美元,此轮融资将对该公司的估值定为20亿至25亿美元。消息人士称,马蜂窝希望利用融资获得更好的旅游资源和产品,并更好地将其现有旅游内容商业化。目前,融资金额和公司估值并未最终确定。
图/网络
虽然在此前的多轮融资中,旅游内容的商业化都是马蜂窝的主打内容。但在实际运作中,马蜂窝品牌营销的投入似乎比重更大:聘请黄轩为品牌新代言人,花费1.65亿元成为央视世界杯转播的赞助商。但马蜂窝花费巨资的推广广告,因简单粗糙无创意的洗脑式广告内容,引发了大量网友吐槽。
“造假”事件将会对行业产生普遍影响
虽然马蜂窝一直都在不停的进行商业化探索,但身为旅游社交平台,其UGC内容的本质即最大优势,商业化的探索也是在这些内容的基础上进行的有效利用。如今,旅游社交平台的基地被质疑出现造假问题,有观点认为,受到这次事件影响的将不仅仅只是马蜂窝一家企业。
有旅游社交内容的从业人士解释,旅游UGC的网页爬虫抓取,在行业内是比较常规的操作,主要是为了丰富内容和类型。据了解,网页的爬虫抓取并没有太大的技术难度。相比PC端,手机端的数据抓取更为容易。事实上,即便是屏蔽技术较好的PC端,很多反爬虫技术也很好破解。
有从业人员指出,根据目前爆料文章中截取的部分图片来看,强调技术的马蜂窝,其抓取技术水平并不是很强。这是因为在许多网站的数据抓取操作中,都会将内容包含的竞品名称进行自动屏蔽或替换,而马蜂窝截取的部分内容显然并没有使用该功能。
这位不愿具名的业内人士说,一般而言,各旅游社交平台会对内容进行审核,但主要是针对用户提交部分,一般会采取“机器+人工”的方式对提交内容进行审核,虽然各家的审核标准都存在一定的差异,但是大部分审核人员在操作时,更多是对用户提交的内容中的广告、黄赌毒部分甚至是涉及投诉的部分进行审核。而对于用户提交的内容是否涉及抄袭、是否为原创,平台一般无法做出精准判断。有技术人员解释,点评的海量基础数据,无论是使用机器还是人工,进行抄袭审核都是一个工作量极大且存在一定难度的工作。
也正是平台的这一审核漏洞,成为许多人获取不正当利益的手段。尤其是在旅游社交平台发展的前期,平台会投入大量的资金进行活动运营以激励更多用户更加活跃的提交点评。有许多“深谙此道”的用户,就会采取抄袭、搬运的方式大规模提交点评,以获得更多的平台奖励。而这正是马蜂窝等旅游社交平台上会出现许多时间较为重合的提交内容的原因之一。
2015年至2016年是马蜂窝运营活动的活跃期
一位从事互联网数据工作的工作人员透露,其实各家旅游网站的点评、评论都存在互相抓取的现象。虽然《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章指出马蜂窝涉及抄袭的数据占其总点评数的85%。可实际上这些作为参照对象的点评内容的原创性也并不好考证,也就是说,文中所说的来自其他网站的点评内容极有可能也不是原创的,而是被抓取甚至抄袭来的。在他看来,从旅游社交评论网站的用户黏性与活跃度而言,马蜂窝上大部分的评论内容还是较为真实的。此外,也有自称为旅游供应商的用户留言,称其在自马蜂窝上线以来,每个月都获得了大量订购流量,并由此认为马蜂窝的数据并没有网络文章所说的那么假。
由此看来网友对于马蜂窝被指数据造假的看法也是褒贬不一。而截至发稿,马蜂窝尚未对事件进行详细回应。目前看来,至于“旅游之前,还要不要先上马蜂窝”的解惑,仍需等待。
文 | 王真真 王胜男
文为新京报每日旅游新闻(ID:xjblvyou)内容