时间: 2015年10月15~17日
地点: 上海·光大会展中心国际大酒店

专题: 新兴大数据处理

Day of week:

基于开源Hadoop族的大数据处理框架逐步成熟,业务已无法满足于以天级别批处理为核心的指标统计和数据挖掘体系,新兴大数据技术亟需拓展到更多领域:面向安全/监控/推荐等需求的大规模实时计算,数据更便捷的上传/下载云计算平台,O2O业务大发展下的物联数据无缝接入。让我们共同探讨从数据接入到实时计算、再到用户数据触达,这样一个“范大数据”场景下的新兴大数据技术实例。

专题出品人:
闫剑锋
博士,远景互联,数据产品和技术部负责人

具有15年数据相关研究和工作经历,专业领域在数据平台构建和数据仓库建模,互联网数据产品设计,基于数据仓库和商务智能的知识发现,以及数据挖掘和并行/分布式数据管理系统。

曾就职于多家IT和互联网企业,参与高性能数据处理和In-Database分析的相关研发工作;搭建典型互联网公司的用户行为数据仓库;指导从分布式大数据平台到数据展示产品的研发工作,从基础数据规范到仓库建模,再到公司指标体系的构建工作。

数据技术上,始终坚信两点原则:

One size does not fit all (M. Stonebraker):不同的应用需要不同的技术做支撑,平台的责任就是无缝的拼接不同技术底层

Cloud is just automation (J. Hamilton):云的概念事实上是在通过自动化手段降低成本,提高效率并保障质量


by 符茂松
Twitter公司软件工程师

数据规模的增长,人们对运行响应速度的要求比你我想象得还要快,还要快。

我会从大数据时代对实时分析的需求出发,对需求进行分析,以及如何设计实时处理框架,现存的实时处理框架是如何满足这些需求的。

我会着重分析Twitter的两代实时分析框架,Storm 和 Heron,主要从以下点:

      • 1.设计目标,即针对的需求,如性能,容错性,易调试性等
      • 2.架构设计,这包含:
      • A.即如何在总体上满足设计目标
      • B.需求提供怎样的接口、功能
      • ...

by 桑文锋
Sensors Data创始人&CEO

初创公司在数据分析方面有哪些错误的认识?初创公司如何实现数据驱动?如何从零搭建数据分析平台?如何规范数据?如何数据建模?如何构建查询分析平台?在数据分析平台建设上,有哪些关键问题?本演讲希望为你打通任督二脉。

演讲的主要内容包括:

  1. 对数据驱动,有哪些是是而非的认识?理想状态又是如何?
  2. 现有常用方案剖析,有哪些优势及不足;
  3. 推荐的一套方案,包括数据的采集、传输、建模存储、数据统计分析挖掘、数据可视化与反馈;
  4. 演示一个电商数据分析的案例。

by 程书欣
点融网技术部-数据组高级数据开发工程师

近些年来互联网金融蓬勃发展,特别是P2P的兴起,颠覆了传统的银行贷款模式,给大众带来快速便捷的金融服务;在P2P行业中,借款端的欺诈风险是P2P公司面临的主要风险;传统银行的风控手段主要依赖于信息的人工审核,所需成本较高并且风控周期较长,而大数据成为了反欺诈手段的有利提升点。

不论应用场景如何变化,数据仍然是反欺诈的核心,我们的数据来源包括点融网内部数据,互联网公开数据以及第三方的数据提供商的数据;由于数据来源多,数据异构碎片化,结构、半结构和无结构数据共存,并且规模庞大增长迅速;为了应对这个挑战,我们需要在不同维度上建立信息的相关性,而图的数据结构对信息聚合具有天然的优势;我们利用图的数据结构,构建了反欺诈的知识图谱,有效抵御了个人信息造假,组团欺诈的风险;我们取得了一定成果,但P2P风控技术仍然充满挑战,希望可以和大家多多交流、合作。


by 周东祥
腾讯互动娱乐的运营部高级工程师

在游戏行业,尤其是腾讯游戏作为行业的领头者,在游戏大数据方面是如何应用与服务的。

我将介绍腾讯游戏Billow巨浪大数据服务平台,主要分为三种主要分服务场景:

  1. 采集与传输TGlog
  2. 实时计算RealTime
  3. 在线与适时计算Online

我将分享是如何通过分布式游戏数据采集Tglog组件更加高效、实时、可靠地采集与传输游戏的海量数据,同时也会探讨到腾讯游戏大数据和一般的互联网大数据采集的共性与区别。以及并如此海量的数据上结合实际的应用场景实时RealTime与适时在线Online计算,实时计算是如何提供在原有基础的离线分析提供不了实时交叉、关联分析、事件触发以及提供了实时在线游戏营销活动方案。

同时介绍到大家在微信朋友圈中游戏中心的实时荣誉系统的具体实现,以及腾讯游戏实时在线交叉引流营销案例积分墙系统。着重给大家分享到腾讯游戏通过Billow巨浪平台应用实时与在线计算,在实际的营销场景、在线服务场景落地应用的。

最后,...


by 朱冠胤
百度开放云大数据负责人,基础架构部高级技术经理

2015年9月8日,百度世界大会正式对外发布百度开放云大数据解决方案,多个曾获得百度最高奖的大数据分析和挖掘产品正式以服务形式对外开放,这些产品和服务对内支持了百度23个用户量过亿的产品,包括但不限于手机百度、百度地图、百度云盘、百度贴吧、百度知道等,还支持了包括凤巢、网盟等百度推广产品,超过百万广告客户;本次分享将这些产品和服务背后的故事,包括架构演进历程,面临的主要挑战,解决思路和实施过程,同时还将介绍百度在该领域的最新思考。演讲内容将包括:

  1. 全球最大Hadoop平台演进历程
  2. 百度在大数据处理方面的最新思考
  3. 百度开放云大数据解决方案

by 林小进
远景能源高级工程师

远景能源作为全球智慧能源管理领域的技术领跑者,远景能源未来将借助智能控制、智能传感、云计算、大数据和能源管理等技术,积极构建全球智慧能源蓝图,推动传统能源领域的智慧变革。

我们的数据来源广泛:风电设备、光伏设备、数据采集器、其他厂商的软件系统等,为保证这些数据的准确性、可靠性、稳定性,数据的采集与获取技术显得尤为重要。数据如何从源头进入系统,做了哪些处理,整个过程将引人入胜,尽请关注。

演讲专题

Covering innovative topics

10月15日,星期四

  • 可扩展、高可用架构

    很多互联网(包括移动)业务成长非常迅速,在系统搭建之初和成长阶段就需要充分考虑系统架构设计,以满足在稳定性、扩展性、性能和成本方面的要求。

  • 新时代的前端

    最近几年,Web前端领域的新标准、新框架、新工具、新理念不断涌现。今年6月,ES6正式发布,也标志着Web前端已经进入了一个全新的时代!

  • 运维之痛

    最近互联网公司接二连三的故障,黑天鹅事件层出不穷,让我们更加体会到了运维人员的痛苦。谁来拯救我们苦逼的IT运维工程师!

  • 技术创业

    分享技术人创业案例,揭示背后的技术选型,人才招聘与培养等背后故事。

  • 开源实践

    很多企业都在拥抱开源,开源能给公司带来哪些好处?又有什么样的问题?

  • 数据分析与移动开发工具专场

    本专场将邀请来自大数据及移动应用服务相关供应商的Hadoop、机器学习、即时通讯等领域的技术专家,分享各自在全民大数据化背景下的最新技术实践经历,内容涉及前端数据收集、数据分析模型、数据安全等多个方面。

10月16日,星期五

  • 新语言与新发展

    现代软件开发,已经进入一个普遍的复杂系统的时代。了解编程语言的发展趋势,对我们是一件有意义且有趣的过程。本期我们邀请几位专家,介绍这几年进入应用领域的新语言和新特性。

  • 新兴大数据处理

    大数据的批量处理框架趋于完善,业务还需要什么?更大规模的内存和实时计算?更便捷的用户数据交互和触达?更高效的业务驱动?还是来自物联世界的数据接入?

  • 移动开发新趋势

    移动互联网是这些年发展最快的技术领域,也是机会最多的领域,从无到有的这几年,这个领域已经吸引了大量的工程师,资金和创业项目,在这个迅速变化的时代,在这个变化最快的领域,我们都需要随时保持学习。

  • 建设高效团队

    团队的特点就在于具有统一的目标,并且成员可以为其通力协作。在本话题中我们会讨论,如何建设起高效的团队,并使其一直保持高昂的战斗力,高速、高质地完成各种任务。

  • 大规模软件持续交付与改进

    越来越多的大型企业在市场残酷的冲击下,需要快速地转变以应对市场的快速变化,其中最重要的是如何缩短产品上市周期。通过一组精彩的真实案例,看看“别人家”如何快速持续交付及改进。

  • 公有云服务与基础设施建设专场

    本专场将邀请多位来自云服务供应商的CDN、容器、OpenStack技术工程师,分享最新的云计算实践经历,探讨云服务及IT基础设施建设的发展趋势,内容涵盖微服务架构开发、持续交付实践、网络加速等热门话题。

10月17日,星期六

  • Java问题诊断与性能优化实践

    当Java系统变得日趋纷繁复杂,背后日益凸显的性能问题就会变得越发的举足轻重。本专题会从不同角度,多领域,结合云计算,大数据的当下,审视和关注在不同层次上,不同领域内Java性能问题以及优化实践。

  • 安全与隐私

    应对安全挑战。

  • 容器与云计算

    Docker容器和集群管理技术的背后是什么原理,能解决什么问题,有什么最新进展?关注Docker容器技术, Mesos等集群管理技术的原理和实践,容器相关的云计算服务。

  • 基于大数据的机器学习技术

    本专题将介绍业界最为前沿的大数据和机器学习技术,以及它们在搜索、推荐和数据挖掘等场景下的应用实践。我们邀请了国内一线互联网公司的技术精英们,看他们是如何利用机器学习技术让大数据产生真正价值的。

  • 互联网产品案例研究

    通过一组经典互联网产品案例分析,看看他们在产品开发过程中对设计、技术和市场等因素的决策过程,是如果一步步走到今天的产品形态的,曾经放出哪些大招或者下出哪些臭棋。

  • 开发平台与服务技术实践专场

    本专场将邀请来自应用开发平台及服务供应商的资深研发工程师、高级程序员及技术专家,分享敏捷开发、搜索引擎优化、容器应用管理等方面的技术实践与创新经验,以及应用开发领域目前所面临问题的解决之道。