基于汉明距离分类算法的精准营销

发布日期:2018年9月14日
基于汉明距离分类算法的精准营销 基于汉明距离分类算法的精准营销

本内容试读结束

下载后可阅读完整内容,立即下载

随着大数据时代的到来,企业营销将不再局限于传统的营销理念与手段,依托现代信息手段,达到精准营销将成为潮流趋势。本文主要研究基于某品牌手机的购买数据,针对用户的个人信息和行为偏好,采用汉明距离分类算法和BP神经网络,对用户进行分类,从而达到精准营销的目的。 *通讯作者。

精准营销[1]是通过分析海量数据下所隐藏的消费者的行为习惯,个人偏好,全方位建立个性化的顾客沟通服务体系,一对一动态预测消费者的消费需求,区别于传统营销的无针对性的静态推销,极大地降低了营销成本。

本文通过探索用户与用户,用户与商品,商品与商品之间的关系,分析影响该品牌手机的购买的因素:目标用户的基本属性特征、基本行为特征以及个人偏好,基于“神经网络”的目标用户群潜力值建立潜力挖掘模型,对不同目标用户群进行不同的营销手段,从而提高购买率。

2. 数据预处理 由于各表数据总数不一致但均为目标用户的基本行为特征以及个人偏好,因此本文认为数据具有重复值,按照用户编号进行筛选,剔除用户编号重复项数据[2],总共得到4840 位信息完全的目标用户,本文在接下来的数据分析中将采用信息完全的目标用户数据;因此剔除50 个测试样本,得到4790 个训练样本。

3. 数据分析与建模 3.1. 数据编码 编码与编码之间的距离在信息论中称为汉明距离,用于度量编码与编码的相似性与差异性[3],汉明距离越大表明编码与编码之间的差异性越大。

引用此概念,为研究个人偏好是否对该品牌手机的购买是否产生影响,在用户个人行为中提取出若干个指标[4], 对用户中发生的行为编码为1, 未发生的编码为0。

通过对数据的分析, 发现用户数据中“触媒行为”“视频行为”这两组数据信息在一定程度上可体现用户的个人偏好,“电商行为”这组数据可了解用户的主要手机品牌偏好,因此本文将触媒行为、视频行为、电商行为作为个人偏好指标,编码规则如图1。

3.2. 汉明距离分类算法(HMCL Algorithm) 对用户行为编码后, 是通过计算编码与编码之间汉明距离的大小来度量用户之间的相似性和差异性, 其值等于码元与码元对应位置的值相减后取绝对值再相加,汉明距离越大表明编码与编码之间的差异性越大;在本文中将用户的行为信息进行编码后,可由用户和用户的汉明距离大小是否属于同一阈值判断两两用户是否属于同一个类别。

得到目标用户个人偏好之间的联系,从而找到个人偏好相似度高的用户群体,汉明距离分类算法[5]基本步骤如下:



相关标签