自古以来旅游是中国文化不可缺少的一部分,发展旅游也是为了弘扬中国的民族精神。同时,国家也将发展旅游行业制定为带领偏远地区致富脱贫的方案之一,所以各级政府及相关部门格外重视旅游景区的发展。
但在如今的信息爆炸的时代里,中国互联网的流量每天产品的信息量可刻满1.88亿张光盘,其中人们一天上传的照片数量相当于柯达发明胶卷后拍摄的图片总和。这意味着当旅游景区想要做传播的时候,出一个创意内容或一条传播信息时,就像一滴水掉进了大海,无踪无迹,传播何其难!
面对这一问题,政府及有关部门首先想到的是利用大数据技术来为各地旅游景区提升收益。经过近几年大数据的发展及旅游行业相关政策法规的公布,各景区对大数据逐渐的由陌生到了解,逐渐认可旅游大数据,并开始使用旅游大数据帮助景区提升收益。
最近,某旅游景区找到了佳都科技参股公司睿帆科技,希望利用大数据技术解决广告营销投入居高不下,ROI持续走低的现状。针对这一问题睿帆科技迅速组织相关人员开会,经过会议商讨得出,解决这个需求的方法是通过技术找到景区广告没有覆盖的区域,即统计清楚每位游客的来源地,找出游客较少的区域。 确定好技术目标以后,第一步,将原始数据里的每个人进行网格化。佳都科技CTO王雪博士表示,网格化是将已经导入的海量原始数据中每个人的位置先从分布式数据仓库中调取,然后对数据进行预处理合并每个人的停留时长,最后按照时间为维度放入地图上既定的500m x 500m 的范围,再通过分布式计算形成统一的以时间变化的ID编码。 例如,某景区是5000m x 5000m的正方形区域,其就会包含100个500m x 500m的范围。将该景区的编号设置为“A”,其中每个500m x 500m的范围就是“A1-A100”,然后将这些景区编号按照每个人的时间维度进行标记。即,张三,13点出现在A1区域,15点出现在A8区域,20点出现在Z13区域等。 如果景区不是正方形区域,则会通过景区凹多边形算法划定景区范围。首先,在所有景区的坐标点中找出纵坐标最大的A点,如果有好几个点的纵坐标都是最大的,就从中选出横坐标最小的点定为顶点,这种方法从数学上可以严格证明一定是最大凸多边形的顶点。 其次,连接A点和剩下其它点,形成一系列向量AB,从正向X轴出发顺时针旋转一个角度之后会和向量AB重合,记录下这个最小夹角α。如果有好几个点都形成相等的最小夹角,那么我们选择线段AB长度最长的B点,这个B点就是另一个顶点。以此类推,重复上面的步骤即可圈定景区的范围。 最后,规定每个网格化人的中心点落入景区网格即判定该人在景区旅游。 “选择500m x 500m的区域是因为这样不仅可以达到数据收集的目的,又可以有效的保护每个人的隐私,就像我说我在望京和我在望京SOHO完全是两个概念。当然在姓名年龄等信息我们也是采取编码加密的方式,举例张三只是帮助理解。”王雪博士表示。 第二步,对游客的筛选。在原始数据中,会包含居住人员、在附近工作人员以及过路人等。根据每个用户的行为习惯,筛选出真正的游客。“居住人员一般只有晚上会在附近出现,工作人员每个工作日会在白天固定时间出现,过路人停留时间短,排除掉这些干扰的数据,我们才能找到真正想要的游客数据。”王雪博士表示。 第三步,对游客追踪地的查找。找到真正的游客,只需追寻他的出发地即可找到游客的来源地。然后再将游客来源地进行统计,找到游客量较少的区域进行重点的广告投放。 公司拥有业内领先技术,可以通过技术手段将游客的居住地精准到县,这极大的为旅游景区降低了广告营销的投入,帮助旅游景区提升了ROI。佳都科技致力于解决大数据技术门槛高、实施周期长、技术人员缺乏等问题,帮助客户降低应用大数据技术的成本和周期,提高数据资产转化为客户价值的能力。
感谢您的留言,我们会第一时间联系您!