张乐
-
Python基础教程3:中文编码
前面章节中我们已经学会了如何用 PHP 输出 “Hello, World!”,英文沒有问题,但是如果你输出中文字符”你好,世界”就有可能会碰到中文序号问题。 Python 文件中如果未指定编号,在执行过程会出現有误: #!/TPPN/bin/pytho…
-
TalkingData CEO崔晓波:移动互联网让数据变成可能
11月21日,以“新巨头·新生态”为主题的“WeMedia2015中国自媒体年会”在北京香格里拉酒店盛大召开。数十位行业领袖、国内知名自媒体、跨界明星齐聚于此,共同见证互联网新巨头诞生,展望新生态新景象。第三方数据公司TalkingData CEO崔晓波接受了Bianews的专访。 用数据说话 崔晓…
-
重新认识大数据,听听MIT-CHIEF圆桌会议5问大数据
编者按:人人口中都在谈论着大数据,但是你真的知道大数据是什么吗?获取数据的过程中有哪些挑战,又要如何挖掘其中的商业价值呢?让我们听听大洋彼岸的从业者和专家们对大数据的解读吧。本文来自 Lucia Shen 的投稿。 在过去的周末,一年一度的美东华人创业狂欢 MIT-CHIEF年会在麻省理工落下帷幕,…
-
新浪微博的推荐算法简述
在介绍微博推荐算法之前,我们先聊一聊推荐系统和推荐算法。有这样一些问题:推荐系统适用哪些场景?用来解决什么问题、具有怎样的价值?效果如何衡量? 推荐系统诞生很早,但真正被大家所重视,缘起于以”facebook”为代表的社会化网络的兴起和以“淘宝“为代表的电商的繁荣,”选择“的时代已经来临,信息和物品…
-
如何有效地对数据进行可视化
如何才能做好大数据的可视化呢?今天,我们来回答一下整个问题。 整个设计流程中,数据是基础,如果仅仅是把数据置于孤立、静态的图形中,则会限制可视化能够回答的问题数量,让数据贯彻其中,把来龙去脉娓娓道来,成为数据可视化的核心所在。 数据可视化,并不意味着一定要使用很炫的图形,不同类型的数据需要的展现方式…
-
高德:2015年Q3中国主要城市交通分析报告
11月24日,国内领先的数字地图、导航和位置服务解决方案提供商高德正式发布了《2015年第三季度中国主要城市交通分析报告》。报告显示,本季度济南超越北京,拥堵排名由上季度第四飙升至第一,成为全国最拥堵的城市。而其它国内十大堵城依次为北京、杭州、广州、哈尔滨、深圳、上海、大连、重庆、青岛,其中青岛为首…
-
IBM开源机器学习系统SystemML
继 Facebook 开源Torch、Google 开源TensorFlow以及微软开源分布式机器学习工具包DMTK之后,IBM 成为今年第四家开源自家机器学习系统的巨头,这显示出机器学习的生态构建与人才争夺战的白热化。IBM 开源的这套系统叫做SystemML,将会通过 Apache Softwa…
-
以色列大数据分析公司Iguaz.io获1500万美元A轮融资
以色列的大数据分析公司Iguaz.io最近获得 1500 万美元 A 轮融资。Magma Venture Partners 领投,Jerusalem Venture Partners 和一些未具名投资人跟投。 这家公司表示,它们正在以一种新的方式重建大数据处理框架,整合来自海量的存储和运算平台的信息…
-
Glassdoor:大数据工程师平均年薪为11.9万美元 就业排名第一
“大数据”时代,数据成为决策最为重要的参考之一,与此同时自然也催生出了一些与大数据处理相关的职业,他们通过对数据的挖掘分析来影响企业的商业决策。 在中国,大数据的应用才刚刚萌芽,很少有全才来完成所有环节。于是每家公司根据自己已有的资源对大数据工作提出了不同的要求:有的强调数据库编程、有的突出应用数学…
-
网站常用的数据分析方法介绍
本篇文章我们介绍4种网站分析中最常用,也是最有效的分析方法。他们分别是细分分析,对比分析,对比分析,质与量分析。这些分析方法在实际工作中经常组合使用。我们先来看下细分分析。 1, 细分分析 单一的指标数据或大维度下的指标数据是没有意义的,只有当指标与维度配合使用时才有意义。细分也叫下钻,是网站分析中…
-
网站数据分析:跳出率和退出率
【编者按】做网站数据分析的,GA工具的强大就不用多说了,在使用GA中经常会看到的就是跳出率和退出率。但GA上也没有很明确的告诉我们什么意思,作者和大家讨论讨论,分享一下在GA方面的知识。 退出率: 一般而言,一个网站可能有不同的链接导向到网站的不同网页里,这些不同的链接就是这个网站的不同入口。 当访…
-
数据挖掘中易犯的10类错误
按照Elder博士的总结,这10大易犯错误包括: 0. 缺乏数据(Lack Data)1. 太关注训练(Focus on Training)2. 只依赖一项技术(Rely on One Technique)3. 提错了问题(Ask the Wrong Question)4. 只靠数据来说话(List…
-
用R语言进行数据分析:常用函数参考
基本 一、数据管理 vector:向量 numeric:数值型向量 logical:逻辑型向量 character;字符型向量 list:列表 data.frame:数据框 c:连接为向量或列表 length:求长度 subset:求子集 seq,from:to,sequence:等差序列 rep:…
-
用R语言进行数据分析:命令行编辑器
C.1 预备工作 如果你的 UNIX 系统已经安装了 GNU readline 库, 那么 R 配置中允许在 UNIX 下编译 R 代码,调用内置的 命令行编辑器,编辑和重新调用以前用过的命令。 注意:该附录提到的接口不是用于 UNIX 系统的 GNOME接口,而仅仅用于标准的命令行 接口。 如果启…
-
用R语言进行数据分析:一个简单的会话
下面的会话让你在操作中对 R 环境的一些特性有个简单的了解。你对系统的许多特性开始时可能 有点不熟悉和困惑,但这些迷惑会很快 消失的。 登录,启动你的桌面系统。 $ R 以适当的方式启动 R。R 程序开始,并且有一段引导语。 (在 R 里面,左边的提示符将不会被显示防止 混淆。) help.star…