中国80%的电子商务市场是在淘宝和天猫平台上(以下统称TB),对TB公开数据进行分析,是学习掌握电商大数据的第一步。使用我们的客户端软件,用户可以长期全自动的采集TB的自然搜索和直通车的相关数据,无需部署任何复杂的软硬件设施。
启动采集数据过程非常简单,用户只需在采集页面的文本框中输入若干个自己关注的关键词即可。软件会自动使用这些关键词去获取TB上对应的搜索结果页面(缺省设置为前10页,用户可以设定更小或更大的值),并提取出页面中包含的三种数据:
自然搜索记录: 每页有44行,对应每一行存入数据库的字段包括采集时间、关键词、页面位置(即第几页第几行)、商品ID、是否天猫店、商品标题、卖家ID、地理位置、标价、销量、评价数。软件将最近7天采集的数据保存在本地浏览器中,每个宝贝每个关键词仅保留最新数值;用户可查询任一店铺在监测范围内的排名、引流数据。
提醒:请勿清空当前浏览器Cookie,否则会导致这部分数据丢失。建议每天开机立即启动软件,增加监测时长,有助于数据分析。
会员登录后采集的数据适用于情报集合『我的大数据』各项菜单。
直通车单品广告: 每页有16行,对应每一行存入数据库的字段包括采集时间、关键词、展示位置(即第几页右侧第几位或底部第几位)、商品ID、是否天猫店、商品完整标题、卖家ID、地理位置、促销价、标价、广告标题;
直通车店家广告: 每页有3行,对应每一行存入数据库的字段包括采集时间、关键词、展示位置(即第几页右侧下方第几位)、卖家ID、是否天猫店、加红关键词、广告标题、副标题;
电商各种数据源量级巨大,但是相对粗糙、噪声高,甚至部分是流水,经过数据的筛选、洗涤、转换、聚合等动作之后,“大数据”往往会变成可供商业分析和挖掘“小数据”。所以,大数据是相对的。商业中(包括电商行业)的大数据一般指的是数据维度比较丰满且数据观测数在1000万以上的规模。
如果你赞成以下一半以上的观点,请勿错过数据驱动电商的大数据时代:
电商运营者,要更擅长根据需求“养”数据,数据“养”到一定程度,就会有价值。
电商大数据不一定量级要有多巨大,但数据维度要尽可能丰满。
商品打折优惠的幅度应大于11.6%,因为11.6%是一个阈值,为人类的最小心理感觉差。
50%的客户点击网站的次数都在3次以内。
快销品类目购买7次以上的客户便是绝对忠诚的客户。
新客户在收到商品后的10天之内二次购买的概率最高。
真正的大数据,不是噱头,更不是空心的概念,是“梦想照进现实”般的落地和丰厚的经验价值。
――摘自《电商大数据——用数据驱动电商和商业案例解析》