1. 数据分析网首页
  2. 大数据
  3. 数据挖掘

大嘴巴漫谈数据挖掘:卡片分类排架构,开放聚合按距离

卡片分类排架构,开放聚合按距离卡片分类法选择结构设计的最终使用者作为目标用户。用户数量可以根据卡片数量的多少来确定,在没有特别要求的情况下,一般建议15人左右为宜。首先将待分类的内容用一句总结性的语言进行概括描述,然后做成卡片的形式,卡片正面描述分类内容,背面显示标记序号,便于后续统计分析。

如前所述,封闭式卡片分类法最初类别已定,对于某一卡片,用户投入最多选择比例的类别即为该卡片的所属类别。

卡片分类排架构,开放聚合按距离通常情况下,封闭式的卡片分类法针对于信息量很大的产品,可以事先让目标用户确定信息块的个数及内容。如上所示,根据确定划分类别的用户数量占比,表中的卡片2和卡片4应归为类别1,卡片1、卡片3和卡片6应归为类别2,卡片5和卡片7应归为类别3。如果产品包含的信息量较小,那么可以采用开放式的卡片分类法。

卡片分类排架构,开放聚合按距离开放式卡片分类采用分组聚类法,通过综合计算将卡片分类结果转化为距离矩阵形式,基于距离矩阵并最终生成易于理解的冰柱图。具体过程中,首先生成相关度矩阵,矩阵按照对角线对称,每个单元格的值为两个卡片归为一类的相关度,如上所示,如果某一个用户将两个卡片归为一类,那么单元格的值所表示的相关度为1。

卡片分类排架构,开放聚合按距离当进行多用户实验时,即在用户为多个的情况下,相关度矩阵中单元格值的定义为将两个卡片归为一类的相关度累积之和,也就是需要汇总卡片归类的用户总数。如上所示,假设有3个用户将卡片1和卡片7归为一类,那么累加求和之后,其对应的相关度值就为3。

卡片分类排架构,开放聚合按距离接下来需要将多用户相关度矩阵转化为距离矩阵。此处用“距离”来衡量两个卡片之间真正的相似程度,卡片类别的划分依据便基于此。具体转化方法按照公式1-相关度/2N,其中N为总的用户数。如上所示:卡片1和卡片7的相关度为3,距离就等于1-3/2N。

卡片分类排架构,开放聚合按距离针对于某一特定网站的信息架构,包括各种信息内容,有新闻中心、电视剧、艺术、用户专区、纪录片、电影和读书7个卡片,希望借助参与式设计来了解用户希望如何分类,其中试验用户总数为15人。

实验过程中,组织者先要向用户阐明整个实验的流程和目的。同时,研究人员应对用户行为保持关注,以确保用户能够准确理解卡片内容,分类过程如有明显不合理处,应与用户及时沟通,查明问题所在。

卡片分类排架构,开放聚合按距离按照开放式卡片分类的方法,收集每个用户对卡片的归类信息,整理成对应的相关度矩阵,如上所示,比如“新闻中心”和“纪录片”之间的相关度是1。求出相关度后,就可根据先前定义的距离公式进行转化,其中总用户数N等于15,根据计算结果,获得两个卡片间的距离值为0.97。

卡片分类排架构,开放聚合按距离然后便是基于距离转化公式,将整个相关度矩阵转化为距离矩阵。有了距离矩阵后,首先选取距离矩阵中两两间的最短距离,“电影”和“纪录片”的距离最短为0.6,因此将这二者首先合并为一个新类,然后重新调整距离矩阵,并不断重复前面的操作步骤,直到最后达到分类要求,完成聚合过程。

卡片分类排架构,开放聚合按距离分类聚合结束后,还要根据合并结果进行业务上的解释。如上所示,其中电影、纪录片和电视剧频道这三个卡片聚合为一类,命名为视频板块会比较贴近实际的业务含义。新闻中心与用户专区频道合并为一类,命名为首页板块。读书及艺术频道归结为一类,命名为文化板块。

卡片分类排架构,开放聚合按距离综上可知,针对信息类业务,卡片分类方便易用,能够合理组织诸如网站等产品的信息架构,有助于收集和管理信息,确定最佳的内容布局,导航结构,安排文本图片等,以及从中找到有价值的设计方案,更全面地理解目标用户,为后续产品研发提供有力支撑。

大嘴巴漫谈,有货,有形,有味!

本文为专栏文章,来自:大嘴巴漫谈,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/10231.html 。

分享本页
返回顶部