您的位置:首页 > 产品知识

产品知识包含零经验转型策略产品你需要掌握这些知识点(2)

日期:2020-05-08 23:20:33 点击:0 来自:本站 作者:

  作为一名没有“搜索/推荐策略”经验的产品经理来说,想要转型策略产品有可能吗?转型路上都要学习什么知识与技能呢?笔者将结合自己成功转型策略产品经理的经验,为你分析需要掌握的知识点。

  当我们有了标签体系,采集到了用户的数据,我们要从这些数据中“读”出有用信息从而为用户打上标签,这里会涉及到数据挖掘,自然语言处理,语义理解,机器学习等技术。

  说几种比较简单的分词方法,比如按照字典分词,字典通常采用前缀树或者后缀树的数据结构存储,进行正向最大匹配。

  以上面的为例“如”后跟“果”,“如果”是一个词语,再看第三个字“如果真”不是一个词,继续向下,发现都不是一个词组,那么就在“如果”这里进行切分。“计算”是一个词,继续向下“计算机”也是一个词语,“计算机就”不是一个词语,再往下发现到最后依然组不成词组,那么在“计算机”这里切分。

  以上句子存在的交集型歧义也需要解决,“如果”和“果真”都是词语,语义理解时计算机语言读懂句子用到的是“如果”而不是“果真”。

  这里还有一种分词方法是基于统计的分词方法,即我们常说的贝叶斯分词,即通过大量语料积累进行机器学习,统计出一个字后面跟另一个字的概率,从而进行分词。

  语义理解中还要进行情感的理解,以及逻辑推理。情感理解,举个例子,如果是在OTA上定了一个旅店,住了一晚然后给出了评价,比较明显的情感评价是“环境太好了”“热水器真糟糕”。

  不易发现的情感如“提供了早餐”,其实我们可以看出提供早餐是用户的褒义评价,但可能一般的算法读不出来。

  再比如如果网购的地址填写的是学生宿舍,那么算法也需要大量学习,进行推理,从收货地址是学生宿舍推理出用户是学生,这就像百度的知识图谱。

  接下来我想聊一下用户画像的几个分类,比如基本信息,如姓名,性别,年龄,生日,星座,设备号,职业,学历,手机号,邮箱等。这类特征是可以长时间不进行更新的,比较固定。

  但对于这个新闻app有个问题,比如对于社交软件,用户乐于填写个人信息,但对于新闻app,可能100人,有30个人填写了信息,另外70个人不去填写。

  比如通过学习,了解男性用户和女性用户的特点有什么不同,比如男性用户早晨更喜欢看时事新闻,晚上喜欢看玄幻小说,女性用户早上喜欢看娱乐热点,晚上喜欢看言情小说。通过得出的这些特征,进行“标签扩散”,为那70个未填写性别信息的用户打上性别标签。

  比如我们为了知道一个用户对哪类新闻感兴趣,设计了一个打分加权模型,每点一个分类的新闻就加一分,线次历史文章历史就是45分,我们可以看出用户最喜欢看的是军事,其次是历史。于是我们主要给他推荐军事,其次是历史。

  但这里有个问题,如果某一天开始,用户开始对娱乐新闻感兴趣了,即他目前更想看的是娱乐新闻,但因为历史数据积累军事新闻权重太高,短期内算法无法推送娱乐新闻给他,那么线性打分模型是不合适的。

  我想这里可以采用指数模型,比如对某个类别的兴趣权重满分是10分,前9次每次1分,第10次开始每次在之前基础上,加9*10的-(n-9)次方,第10次就是9.9,第11次点击军事就是9.99,以此类推,让权重不断逼近10。

  当然我们还要通过其他特征调整权重,比如打开频率,如三天看1次军事的,还是一小时看3次军事的。这样当用户开始对新的类别感兴趣的时候,可以更快的得到推荐。

  比如甲用户喜欢军事和娱乐,乙用户喜欢科技和文学。甲乙用户标签化后相似度很高,达到了一定阈值,那么我们可以认为乙用户喜欢的分类,甲用户可能也喜欢,于是我们把科技和文学推荐给了甲用户。这是基于用户的协同。

  如果有甲乙丙三个用户,甲乙喜欢a文章也会喜欢b文章,丙喜欢a文章,那么我们根据“所有喜欢a文章的用户都会喜欢b文章”可以猜测丙用户也会喜欢b文章。

  基于相似度的推荐涉及到一个公式,这个公式来源于搜索引擎,因为搜索引擎的查询系统要根据用户输入的关键词对抓取到的网页按照相关度进行排序,从而展现在用户面前。这个模型就是向量空间模型,余弦相似度公式。

  我们给用户打上不同的标签,分配不同的权重,比如abc三个标签,权重分别是λ1λ2λ3。每个标签量化到一个坐标轴,这样我们在一个三维坐标系可以唯一确定一个向量。同时我们把众多的新闻也进行向量化,得出和用户标签向量的相似度,推荐排序按照相似度从高到底排序。就实现了推荐。

  但这里也会有一些常见问题,比如如果我们标签打的很多,也就是向量维度很多,其中有一些维度就因为数据空白太多而影响准确性。比如如果“转发”是一个维度,100个用户只有5个人转发,那么在转发这个维度上只有5个人有数值,其他95个人此维度就会被置为空,如果这种维度过多,就影响相似度计算。

  面对这样的情况,我认为是否可以把这样的标签不单独设置维度,而是以加权的形式加到前面维度的权重上,从而解决这个问题。

  这里还有一个问题在于,比如还是在旅店,甲旅店评价标签是环境好5分,设施齐全5分,有早餐3分。乙旅店环境好5分,设施齐全5分。我们显然知道甲旅店更好一些,因为甲旅店还提供早餐,虽然不是5分满分,但多了一个服务。但是如果按照打分模型给标签分配不同的权重,因为早餐这个标签甲旅店不是5分满分,所以总评分反而没有乙旅店高。会存在这样的例子,所以甲乙旅店标签可能需要进行统一化。

  最后我们来说一下地理信息,比如我的常驻地是北京,app每天给我推荐北京本地的新闻,有天我去威海旅游了,那么app本地新闻的版块应当做到灵敏反应。

  再来谈一下高级标签的模型搭建,比如用户流失模型,是一天登一次,三天登一次,一周不登一次,一个月不登一次等等,划分abcd等流失级别。以及活跃度等标签。这种模型更常见的是天气预报app,里面的穿衣指数,洗车指数就通过构建模型建立。

  比如我们针对通勤场景,从用户角度出发,感觉在有线环境下,与无线环境相比,用户更少点击视频或者纯图的资讯。

  将同质用户分组,控制唯一变量,对照组为目前情况,实验组几组分别在有线情况下,减少视频和纯图资讯30%,40%,50%,60%,70%。

  同时我们要多加一组和对照组相同的组,进行aa测试,以保证没有其他因素带来自然波动。后期看数据时方便查看。

  比如我们在一批同质同标签用户中,给其中一部分推送他们喜爱的新闻。我们来看他们的点击次数和浏览时长是否相对另一组用户要大。如果大,可能我们的标签体系就建设的不错。

  我认为不一定,可能他前面看的文章和推荐文章内容相似,也可能前面看的文章内容篇幅高度文笔都高于后一篇。那么如果我们推荐一篇和他看过的文章内容不同,质量相当的他感兴趣的明星的文章,他依然点进去就出来,会是什么原因呢?我认为可能会是观点相反,比如第一篇文章是褒奖此明星的,推荐的是抨击该明星的,所以用户跳出。

  这里我认为文章应该有分级机制,比如分一类二类三类,我从面试官处了解到公司确实有。我继续问比如同一篇文章是否只有一个通用级别,还是说它是军事一类,同时属于历史三类文章。面试官说是通用的,还没有细分。

  还有目前在内容标签体系中也会存在内容交叉的问题,比如军事下面的历史和历史下面的军事,这也是需要解决的问题。

  同时关于内容标签体系的建立,我认为像我开始说到的,关键词提取和标签体系分开。结构化标签和非结构化标签合作。

  提取文中能代表本文内容的关键词,这里我来说一下搜索引擎中的一个tf-idf加权技术,这个技术说的是,如果一个词语再本文中出现的越多,在其他文章中出现的越少,则这个词语具有很好的代表性。tf是这个词语在本文中出现的频率,比如分词后本文有100个词,产品经理出现了5次,则5/100得到的0.05就是词频。

  比如负责 VIP 商户的部门想看上个月每个城市 VIP 商户的销售额和毛利。我们可以用柱状图横向列出各城市的销售额和毛利,上面用扇形图集合分布展示,比如用扇形图的面积代表销售额,面积越大销售额越大,用颜色深浅代表毛利的大小,颜色越深毛利越多。

  如果a和b两个城市扇形图面积差不多大,但是a城颜色更深,那么我们需要进一步分析a城毛利高的原因,从而指导b城盈利。于是我们下钻到下层页面,下层页面可以具体显示ab两城米面粮油四个品类的毛利,我们举例简单点,比如通过对照,发现米面粮ab两城毛利差不多,油这个品类a明显高于b,那么业务人员可以定位到是那个品类的问题,再从也许场景去找到根本原因。

  关于指标和标签我认为应该根据实际情况组合或者分开设计。比如可以把报表,图形,运营工具,标签画像,接口分开。

  当我们的原型图设计好后可以找需求方确认,并邀请研发,业务一起开评审会,确认没问题后开发测试上线。

  但数据产品经理和其他产品经理还是有些区别的,比如一般的产品可能更注重交互,页面美观度,用户感知等。但数据产品更注重逻辑。再比如普通产品如果有问题或者bug如果不是特别紧急可以放在下一版本解决,但是数据产品一旦有问题,需要立刻解决从而保证数据准确性。

  但无论如何我们都要考虑,用户是谁,他们有什么特点,产品价值有多大,目前的满足程度。同时考虑成本与收益的关系,比如考虑人力成本,资源成本,沉没成本,用户成本等。

  当产品开发后,我们可以先为部分用户开放权限进行内测,比如跑一周的数据如果没有问题再进行公测。同时这里应该也要做好用户权限的设计管控,可以把用户岗位职级——系统模块角色——具体模块三者联系起来,让不同部门不同职级不同职责的用户看到不同的内容。

  比如一个业务人员说在业务系统看到a指标的数值和bi系统上的不一样。那么我们首先要确定数据源和指标口径统计方式是否相同。

  在运营中我们可能需要通过分析来发现问题。比如可以通过指标逻辑,比如看到销售额暴跌,影响销售额的子指标是下单商户数和客单价,然后再分析这俩指标,按照指标逻辑看看哪里出了问题。也可以按照aarrr模型(获取,激活,留存,支付,分享)或者漏斗模型(访问,抵达,浏览,咨询,收藏,下单,支付)或者用户操作路径等模型一个个环节分析。

  再比如有个问题,说一家商场中每天的总营业额都差不多,某一天其中一家商店的营业额骤降,商场总得营业额还是差不多。

  那么我们首先应该了解这个商店往日占到商场总营业额的比例,如果比例较高,则表示可能客户流失到其他商店,所以导致商场营业额不变而此商店骤降。

  如果此商店比例较小,不对商场有什么影响。那么我们考虑内外部因素,外部因素比如受到某个事件影响。

  内部因素可从客户体验流程分析,比如商店是否装修,服务是否降低,货品是否过期或缺失,价格是否升高等等。

  面试开始,他先让我做自我介绍,再介绍下以往的经历和做过的项目。然后问到我在那家搜索大厂的经历,虽然当时我做的不是核心策略,但是懂很多的策略知识,我当时也写在了简历上。他觉得我的经历不是很匹配,但看到我简历上所写,就让我说说自己知道的知识,以及如果让我做新闻资讯的画像和推荐我要怎么做。

  我觉得这是个机会,就把前文中提前学到的知识,串起来在面试官面前一步步讲解,说出自己的思考和想法。后来面试官问了几个发散的问题。持续了一个小时,再后来涉及到了算法,于是喊了算法工程师来面我,

  算法工程师问了我对一些算法的基础了解,以及说出一些算法面临的问题该如何调优,让我发散性的考虑下,我做了陈述。又过了半小时,就是hr的面试。一周后我收到了offer。

  对于这次经历,我总结一下吧。我是个普通高校的毕业生,因为大厂对做策略的门槛比较高,要么有经验,要么本科985 211或者硕士毕业,所以之前我会被一些大厂卡。

  当决定一定要向自己热爱的策略努力的时候,我先自己买书学习,在网站上看文章学习,然后做笔记,每次面试前都会过一遍笔记,直到自己可以把那些内容背出来。我也买了一块白板,当自己的一块知识有了架构后,给我做研发的朋友试讲一次,让他也能听懂。表示我掌握了。

  我深知策略需要很强的实践,只有实践才能有经验,那些策略的结果和数据,不是看书或者想象就能得到的。但在没有入行之前,我们唯有不停的学习,拓展知识面,扩充知识储备。等待每一次面试机会的来临。

  人人都是产品经理(是以产品经理、运营为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位服务产品人和运营人,成立9年举办在线+期,线+场,产品经理大会、运营大会20+场,覆盖北上广深杭成都等15个城市,在行业有较高的影响力和知名度。平台聚集了众多BAT美团京东滴滴360小米网易等知名互联网公司产品总监和运营总监,他们在这里与你一起成长。

  公司简介英文公司简介说明

分页:
相关链接 Correlation Link
最新OA界面 New Article
  • 06-08
ASP
ASP
ASP
栏目热门 Class Hot
栏目推荐 Class Commend
版权所有:恒丰娱乐真人版官网 2016-2018 未经授权禁止复制或建立镜像 AG