Afenxi朋友们
-
浅谈用户全生命周期管理
给大家分享他对于用户全生命周期运营的思考和总结,从定义到周期划分,用户分层定义,到后续运营策略方式,系统建设、数据体系等逐步探讨。
-
数据挖掘入门指南!!!
入门数据挖掘,必须理论结合实践。本文梳理了数据挖掘知识体系,帮助大家了解和提升在实际场景中的数据分析、特征工程、建模调参和模型融合等技能。
-
大数据黑产已经无孔不入,该如何破解?
2022,又一千亿级黑产加速灭亡。
-
微服务架构下的分布式数据管理
作者:李晓春 中兴开发者社区 1.1 分布式数据管理之痛点 为了确保微服务之间松耦合,每个服务都有自己的数据库, 有的是关系型数据库(SQL),有的是非关系型数据库(NoSQL)。开发企业事务往往牵涉到多个服务,要想做到多个服务数据的一致性并非易事,同样,在多个服务之间进行数据查询也充满挑战。 我们…
-
我是数据分析师(二):假老公又提数据分析要多表关联—为了爱情,我忍了
文|数加大数据团队 自从上次给老公写了个《我是数据分析师(一):假老公提Excel数据自动更新的需求》教程,他就哼哧哼哧的去做了,就在上周他又提了个新的问题:“我还有一张用户信息,需要跟之前那张销售订单表关联,看看购买的用户的地域来源及年龄情况,要怎么搞?” 于是,就在各位童鞋还沉浸在三八妇女节的欢…
-
支付风控数据仓库建设
作者|凤凰牌老熊 这篇文章是支付风控系统设计的第二篇,重点介绍支持支付风控的数据仓库建设。关于支付系统在风控上的具体需求,参见上一篇文章支付风控场景分析。 支付系统的风控分析需要大量的数据支撑。本文从名单、画像和图谱三个层面,分析在支付系统建设的不同阶段如何建立支持风控计算的数据仓库,详细介绍从什么…
-
从底层到应用,那些数据人的必备技能
根据数据应用的不同阶段,我将从数据底层到最后应用,来谈谈那些数据人的必备技能。
-
机器学习的本质就是数理统计?
这个答案看起来似乎无懈可击,但其实机器学习和数理统计之间的关系远没有这么简单。
-
机器学习模型训练全流程
发现一个很有趣的开源项目,作者用手绘图的方式讲解了机器学习模型构建的全流程,逻辑清晰、生动形象。
-
基于数据科学进行决策,应遵循的五个步骤
寻求利用数据科学进行战略决策的组织应遵循以下五个步骤。
-
如何搭建数据分析指标体系?
最近有同学面试的时候被问到,如何搭建数据分析指标体系?那今天就和大家来聊聊这个事情 阅读路线: 为什么要搭建数据分析指标体系? 如何来搭建一个数…
-
Hadoop常见错误
常见问题及处理 mysql版本,必须是MYSQL5.1。 查询办法mysqladmin version 在建立hive数据库的时候,最好是:create database hive; oozie的数据库,同样:create database oozie; hadoop采集的字符集问题。 修改/etc…
-
一篇文章,搞懂人工智能、机器学习和深度学习之间的区别
为了搞清三者关系,我们来看一张图: 如图所示:人工智能最大,此概念也最先问世;然后是机器学习,出现的稍晚;最后才是深度学习。 从低潮到繁荣 自从 1956 年计算机科学家们在达特茅斯会议(Dartmouth Conferences)上确认人工智能这个术语以来,人们就不乏关于人工智能奇思妙想,研究人员…
-
关于数据治理,你需要知道些什么?
每个有效的企业数据计划都离不开数据治理,也就是精心设计的政策,以明确职责、解决不同利益相关方之间的冲突,提供维护和扩展,保护敏感信息。
-
机器学习项目中的数据预处理与数据整理之比较
要点 在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的功能有重叠,也各有权衡。数据整理是数据预处理的重要扩展。它最适合在可视化分析工具中使用,这能够避免分析流程被打断。可视化分析工具与开源数据科学组件之间…