大会报告

青年论坛

博士生论坛

赞助商报告



大会报告



大会报告1:软件管理是高效使用固态硬盘的关键  Slides

报告摘要

随着固态硬盘(Solid State Device, SSD)大规模的降价和其容量的大大提高,SSD会非常广泛地应用在各个数据存储领域,小至手机,大至云中心。但同时,SSD特有的优缺点也表现得更为突出:(1)随机读数据既高效又廉价;(2)顺序读数据不比在硬盘上快多少,而且费用高;(3)SSD的磨损寿命是很有限的,不必要的擦写必须避免,否则SSD的稳定性将降低。以上SSD的三个常识似乎很普及。但我们发现SSD在工业生产和各种数据存储的应用中没有很好地扬长避短,其主要原因是系统软件和应用软件没有配备有效的管理机制。


在这个报告中,我将介绍我们在软件的各个层面上针对SSD所做的的设计和开发,其中包括操作系统,虚拟机系统,数据库系统和大型数据处理系统。我们的有关学术研究已被通用的计算机产品采用。比如,苹果笔记本和台式机所使用的混合存储产品Fusion Drive 就是来源于我们的研发系统Hystor。 尽管一些硬件厂商尽力推广单一SSD的存储产品,我们的研究表明在有效的软件管理下,一个硬盘和SSD混合的存储系统在性能, 稳定性和价格上都是最高效的。

报告人简介

张晓东是美国俄亥俄州立大学的 Robert M. Critchfield讲席教授,并担任计算机科学与工程系主任。他的研究方向是计算机和分布式系统中的数据和存储管理。 他主持研究的一些核心算法和系统设计已被广泛应用到主流的CPU芯片, 以及主要操作系统,存贮系统,数据库系统和大型的分布式系统中,有效地优化或更新了计算机系统中的一些关键技术。 张晓东在北京工业大学获电气工程学士学位, 在美国科罗拉多大学获计算机科学博士学位,并获得该校2011年度工程与应用科学的杰出校友奖。 他还获得2010年中国计算机学会海外杰出贡献奖。 他是国际计算机学会(ACM) Fellow, 也是国际电气电子工程师学会(IEEE) Fellow。

报告摘要

The continuously increased technical challenges in scaling of mainstream memory technologies motivated tremendous investment on emerging nonvolatile memory (eNVM) technologies. Many candidates, i.e., phase change memory, magnetic memory, and resistive memory, have been identified and studied. Various new applications are also innovated based on these new memory technologies by leveraging their attractive characteristics such as non-volatility, high integration density, nanosecond access time, low operating voltage, etc. In this presentation, we will first go through some application examples of eNVM in different locations in memory hierarchy of modern computing architecture, where eNVM demonstrates unparalleled advantages on capacity, power, system performance and robustness. We will then briefly introduce a revolutionary computing diagram – neuromorphic computing, which is inspired by the working mechanism of human brain, blurs the border between computation and storage, and is recently revitalized by eNVM technologies.

报告人简介

Dr. Yiran Chen received B.S and M.S. (both with honor) from Tsinghua University and Ph.D. from Purdue University in 2005. After five years in industry, he joined University of Pittsburgh in 2010 as Assistant Professor (promoted to associate professor in 2014) in Electrical and Computer Engineering Department. His research interests include low-power design, emerging circuit and computing technologies, storage system, and embedded system. Dr. Chen has published 1 book, several book chapters, and more than 180 journal and conference publications. He has been granted 83 US and international patents with other 17 pending applications. He is the associate editor of IEEE TCAD, ACM JETC, ACM SIGDA E-news and served on the technical and organization committees of about 30 conferences. He received 3 best paper awards from ISQED’08, ISLPED’10 and GLSVLS’13 and other 7 nominations from DAC, DATE, ASPDAC, etc. Dr. Chen received NSF CAREER award in 2013, ACM SIGDA outstanding young faculty award in 2014, and was the invited participant of 2013 U.S. Frontiers of Engineering Symposium of NAE.

报告摘要

大数据是当前的热门话题,大数据的采集、处理、分析、应用涉及多个学科领域,可能带来很大的价值,已经引起 了产业界和学术界的广泛关注。在本报告中, 我将从数据管理系统的角度探讨对大数据的支持。在简介大数据对 数据管理系统主要挑战的基础上,我将集中分析高速数据更新(Velocity)这一挑战。我将介绍近期的两项工作: 1)在数据仓库中支持在线数据更新,2)设计实现一个高时效的日志处理系统。以这两项工作为例,讨论如何有 效地支持高速数据更新,更好地为数据分析服务。

报告人简介

陈世敏是中科院计算技术研究所研究员。分别1997年和1999年获得清华大学计算机科学与技术系学士和硕士学位,于2005年在美国卡内基梅隆大学获得博士学位。博士毕业后,先后在美国英特尔研究院匹兹堡研究所、卡内基梅隆大学和惠普研究院任研究员、高级研究员和科研经理,于2013年加入中科院计算技术研究所任研究员,并入选中国科学院“百人计划”。 陈世敏的研究兴趣主要集中在数据管理系统、大数据处理、并行分布式计算,担任CIKM 2014国际会议程序委员会云计算和大数据分析(Cloud Computing and Big Data Analytics)子领域主席,WAIM 2014国际会议Industry Co-Chair,数据管理新硬件技术子领域的主要研讨会(DAMON)2012年的会议共同主席,ASPLOS’11会议的poster session主席,和多次担任SIGMOD, VLDB, ASPLOS,ICDE, CIDR等国际会议的程序委员会委员。

报告摘要

新型非易失性存储器件(NVM),例如PCM,RRAM和STT-RAM,具有高密度、低延迟和非易失性等特点。将NVM引入现有的存储体系结构(例如 LLC,内存或外存),首先需要解决NVM自身特性带来的挑战,诸如作为内存时较高的写延迟和写能耗,以及有限的写次数。本报告将总结基 于 NVM的内存及混合内存技术,并介绍我们提出的写合并技术和缓存划分技术。其次,从外存储角度出发,NVM的最大优势在于可以提供接近DRAM读写速率的非易失性存储空间,但现有处理器与外存储间的多层数据通路,以及现有存储软件栈制约了NVM优势的发挥。本报告将总结近几年基于NVM的系统软件优化技术,并提出一体化存储系统的概念。本报告将围绕一体化存储涉 及的 体系结构创新、面向应用的精简API操作、硬件原型以及系统软件栈优化进行介绍。

报告人简介

张立新,博士,中组部“千人计划”入选者,2010年8月起为中国科学院计算技术研究所研究员,博士生导师。现任中科院计算所副总工程师,计算机系统研究部主任,先进计算机系统研究中心主任。1993年7月本科毕业于复旦大学,2001年12月博士毕业于美国犹他大学。1999年7月至2001年12月犹他 大学计算机系助理研究员,2002年1月至2003年8月犹他大学博士后。于2003年9月加入美国国际商用机器公司研究院(IBM Research)。2005年至2006年兼任IBM奥斯丁高级学习中心的首席系统和软件专业导师。。

报告摘要

Modern clustered storage systems increasingly adopt erasure coding to reduce the storage overhead of traditional 3-way replication. However, there remain challenging issues of maintaining high performance in erasure-coded clustered storage systems. In this talk, I will share our experiences of deploying erasure-coding-based storage in Hadoop, a popular cluster platform for big data analytics. I will present two new designs: (1) CORE, which augments existing optimal regenerating coding for the recovery of a general number of failures including single and concurrent failures, and (2) Degraded-First Scheduling, which improves MapReduce performance in erasure-coded storage. I will present new analytical results, as well as experimental findings based on our prototypes in a Hadoop cluster.

报告人简介

Patrick P. C. Lee received the Ph.D. degree in Computer Science from Columbia University in 2008. He is now an assistant professor of the Department of Computer Science and Engineering at the Chinese University of Hong Kong. He is interested in various applied/systems topics including cloud computing and storage, distributed systems and networks, operating systems, and security/resilience. His current research interests focus on building dependable storage systems, and in particular, improving the fault tolerance, recovery, security, and performance of different types of storage architectures including cloud file systems and SSDs.





青年论坛


报告摘要

本报告主要介绍大数据基准测试程序集BigDataBench的构造方法学、设计、实现,以及基于BigDataBench所进行的关于大数据处理负载特征的一些分析与讨论。

报告人简介

王磊,男,硕士,中科院计算所高级工程师。主要从事数据中心基准测试程序和数据中心系统软件的研究和开发工作。作为核心成员先后承担相关科研项目10余项、在国内外会议和学术期刊上发表学术文章20余篇。当前的工作主要关注于数据中心基准测试和负载分析。

报告摘要

在当前快速增长的海量数据中,大量的数据具有重复性,去除冗余的数据对于提高存储空间的利用率和网络的传输效率、以及节省数据中心的能耗等方面具有重要的意义。传统的基于数据块指纹比较的精确去重方法能够实现系统级的数据去重,但很难有效地支持大数据环境中面向应用级的实时数据处理和分析,为有效地提高存储系统支持大数据应用需求的能力,需要分析和设计面向应用感知的近似数据去重方法,以有效地提高数据处理的速度和数据分析的效率,实现近实时的存储系统服务功能。

报告人简介

华宇是华中科技大学副教授、博士生导师,IEEE和中国计算机学会的高级会员,计算机学会学术工委通讯委员、信息存储专委委员。曾在美国University of Nebraska-Lincoln做博士后研究工作。主要研究内容包括海量存储系统中元数据的语义管理方法,数据去重机制和近似存储系统体系结构等方面。在中国计算机学会的A类国际期刊和国际会议上发表学术论文16篇,在包括USENIX ATC、SC、ICDCS等B类国际会议上发表论文9篇,发表的学术论文被引用290 多次,H指数是10。其中,海量存储系统元数据管理方法SmartStore被加州大学的IEEE Fellow在存储系统国际会议SYSTOR2013的最佳论文中认为是国际上首次采用空间索引存储元数据的有效方法; 在包括IEEE INFOCOM、IEEE/ACM IWQoS、ICPP等30多个国际会议上担任程序委员会或组委会委员;是国际期刊TC、TPDS、TCC、TVT、JSAC、VLDB Journal等的审稿人。主持两项国家自然科学基金项目、作为学术骨干参加国家973、 863计划重大项目和教育部创新团队项目等。 2010 年湖北省优秀硕士学位论文指导教师。2011年获得中国电子学会电子信息科学技术二等奖。

报告摘要

In the last several years hundreds of thousands of SSDs have been deployed in the data centers of Baidu, China’s largest Internet search company. Currently only 40% or less of the raw bandwidth of the flash memory in the SSDs is delivered by the storage system to the applications. Moreover, because of space over-provisioning in the SSD to accommodate nonsequential or random writes, and additionally, parity coding across flash channels, typically only 50-70% of the raw capacity of a commodity SSD can be used for user data. Given the large scale of Baidu’s data center, making the most effective use of its SSDs is of great importance. Specifically, we seek to maximize both bandwidth and usable capacity.

To achieve this goal we propose software-defined flash (SDF), a hardware/software co-designed storage system to maximally exploit the performance characteristics of flash memory in the context of our workloads. SDF exposes individual flash channels to the host software and eliminates space over-provisioning. The host software, given direct access to the raw flash channels of the SSD, can effectively organize its data and schedule its data access to better realize the SSD’s raw performance potential.

Currently more than 3000 SDFs have been deployed in Baidu’s storage system that supports its web page and image repository services. Our measurements show that SDF can deliver approximately 95% of the raw flash bandwidth and provide 99% of the flash capacity for user data. SDF increases I/O bandwidth by 300% and reduces per-GB hardware cost by 50% on average compared with the commodity-SSD-based system used at Baidu.

报告人简介

欧阳剑,百度基础架构部高级架构师,负责数据中心体系结构方向,关注面向大数据,大规模机器学习和云计算的软硬件协同系统。

报告摘要

数据的爆炸性增长对存储系统的扩展性提出迫切要求,其难点在于如何实现性能随着规模同步扩展并保证在线扩展过程中的数据一致性。报告人认为存储扩展目标实现分为数据均衡和负载均衡两个层面。如果在块级别执行数据均衡,需要对全部数据进行均衡化考虑;如果在文件系统级别执行数据均衡,只需要考虑有效数据的均衡分布;如果将负载均衡和数据均衡分开考虑,可以重点关注热点数据。基于以上考虑,本报告将介绍报告人和同行分别完成的发表在IEEE TC期刊和FAST会议上的三种存储阵列高效在线扩展方法,分别为:采用批量并行的方式进行全部数据迁移的扩展方法、迁移量最小化的扩展方法、只迁移热点数据的扩展方法。

报告人简介

张广艳,清华大学计算机系副教授,主要从事大数据计算、网络存储与分布式处理等方面的研究工作。近年来主要集中在大数据存储及处理的系统结构及可扩展性研究,通过分析并利用数据访问模式特征、底层系统工作机理以及数据自身的演化规律,提出了高可扩展的大数据分布式存储及处理系统构建及优化方法,有效提高了大数据系统的性能、扩展性和可用性。代表性论文发表在FAST 2011、IEEE TC、IEEE TPDS、IEEE TCC和ACM TOS等国际权威会议和期刊上,其中中国计算机学会推荐的A类论文6篇、B类论文4 篇。此外,作为负责人主持自然科学基金项目2项、863子课题1项,作为技术骨干参与973课题、863课题、自然科学基金项目等多项。

报告摘要

Various key-value (KV) stores are widely employed for data management to support Internet services as they offer higher efficiency, scalability, and availability than relational database systems. The log-structured merge tree (LSM-tree) based KV stores have attracted growing attention because they can eliminate random writes and maintain acceptable read performance. Recently, as the price per unit capacity of NAND flash decreases, solid state disks (SSDs) have been extensively adopted in enterprise-scale data centers to provide high I/O bandwidth and low access latency. However, it is inefficient to naively combine LSM-tree-based KV stores with SSDs, as the high parallelism enabled within the SSD cannot be fully exploited. Current LSM-tree-based KV stores are designed without assuming SSD’s multi-channel architecture. To address this inadequacy, we propose LOCS, a system equipped with a customized SSD design, which exposes its internal flash channels to applications, to work with the LSM-tree-based KV store, specifically LevelDB in this work. We extend LevelDB to explicitly leverage the multiple channels of an SSD to exploit its abundant parallelism. In addition, we optimize scheduling and dispatching polices for concurrent I/O requests to further improve the efficiency of data access. Compared with the scenario where a stock LevelDB runs on a conventional SSD, the throughput of storage system can be improved by more than 4after applying all proposed optimization techniques.

报告人简介

孙广宇于2003和2006年分别获得清华大学工学学士和硕士学位,2011年在美国宾夕法尼亚州立大学计算机科学与工程系获得计算机科学专业博士学位。毕业论文“Exploring Memory Hierarchy Design with Emerging Memory Technologies”获得EDAA优秀博士论文奖。 2011年8月至今在北京大学信息学院高能效计算与应用中心任助理教授、特聘研究员。研究方向为高能效计算机体系结构,高能效存储系统,大规模集成电路设计等。近年来在国际学术期刊、国际外学术会议上发表论文50余篇。孙广宇博士一直在多个国际会议和期刊进行学术服务,其中包括担任DAC、ISLPED、DATE、VLSID、ASP-DAC和GLVLSI等会议的技术评议会委员,担任IEEE TVLSI、IEEE ESL、IEEE TCAD、IEEE DTC等杂志的审稿人。孙广宇博士是CCF、IEEE和ACM会员。

报告摘要

We are in a multicore era, when every CPU is produced with multiple cores in the hope that multicore will help increase application performance. However, in datacenters, where replication is widely adopted to protect data in case of machine failure, multicore seems to be useless: traditional replication techniques rely on single-threaded execution to guarantee consistency between replicas, rendering multicore useless. In the work, we argue that single-threaded execution is merely a over-simplification and that replica consistency can be achieved without this restriction. We start by investigating the problem with database replication and propose an solution designed specifically for database system, leveraging the transaction support in database systems. Then, we try to fix the problem for a wider range of applications and propose another set of techniques to capture and replay the causal ordering of synchronizations between threads.

报告人简介

Chuntao Hong got his Ph.D in computer science from Tsinghua University in 2011. He then worked in System Research Group in MSRA till now. His research interests include replication in distributed systems, programming model for large scale computation, and high performance computing.





博士生论坛


报告摘要

传统文件系统过多地针对磁盘特性进行优化,然而这些优化使得文件系统不能充分发挥闪存存储的优势。与传统磁盘不同,闪存有低延迟、高带宽等特点,而且异地更新、块粒度擦除等限制。结合闪存特性与文件系统的设计要求,我们分别从文件系统的存储管理以及命名空间管理这两个主要组成部分分别讨论闪存文件系统的设计。在文件系统存储管理方面,我们结合软硬件协同设计提出对象式闪存转换层设计,以精简不同层次间的冗余设计并充分发挥闪存存取特性所提供的优势。在文件系统命名空间管理方面,我们结合闪存读写特性提出闪存友好的命名空间管理机制,通过分离易失性与持久性目录树的方式,缓解文件系统目录树的随机分散小写对闪存系统性能和耐久性的性能。通过文件系统存储管理与命名空间管理两个方面的研究,讨论基于闪存存储的文件系统设计的挑战和机会。

报告人简介

陆游游,清华大学计算机系博士生,曾获得清华大学计算机系学术新秀、博士生国家奖学金、NVMSA’14最佳论文奖等多项荣誉。博士在读期间,在FAST、IPDPS、ICCD、Cluster、DATE、ICPP等国际顶级或重要会议及IEEE Transaction on Computers等期刊上发表多篇学术论文,其中闪存文件系统方面的工作于2013年与2014年在存储领域顶级会议FAST上连续发表。

报告摘要

In deduplication-based backup systems, the chunks of each backup are physically scattered after deduplication, which causes a challenging fragmentation problem. The fragmentation decreases restore performance, and results in invalid chunks becoming physically scattered in different containers after users delete backups. Existing solutions attempt to rewrite duplicate but fragmented chunks to improve the restore performance, and reclaim invalid chunks by identifying and merging valid but fragmented chunks into new containers. However, they cannot accurately identify fragmented chunks due to their limited rewrite buffer. Moreover, the identification of valid chunks is cumbersome and the merging operation is the most time-consuming phase in garbage collection.

Our key observation that fragmented chunks remain fragmented in subsequent backups motivates us to propose a History-Aware Rewriting algorithm (HAR). HAR exploits historical information of backup systems to more accurately identify and rewrite fragmented chunks. Since the valid chunks are aggregated in compact containers by HAR, the merging operation is no longer required. To reduce the metadata overhead of the garbage collection, we further propose a Container-Marker Algorithm (CMA) to identify valid containers instead of valid chunks. Our extensive experimental results from real-world datasets show HAR significantly improves the restore performance by 2.6— 17X at a cost of only rewriting 0.45--1.99% data. CMA reduces the metadata overhead for the garbage collection by about 90X.

报告人简介

付忞是华中科技大学的四年级博士生,导师是冯丹教授和陈左宁院士,目前在信息存储及应用实验室进行存储相关领域的研究。付忞目前的研究方向包括备份/归档存储系统,数据去重,键值存储等,研究工作发表在USENIX ATC、IFIP Performance、ICA3PP、NAS等国际会议上。实现了数据去重平台Destor,Destor是一个模块化、可扩展的数据去重实验平台,目前已涵盖了十几篇顶级论文的核心思想,可对现有算法和新算法进行评测。

报告摘要

OS-level virtualization is an efficient method for server consolidation. However, the sharing of kernel services among the co-located virtualized environments (VEs) incurs performance interference between each other. Especially, interference effects within the shared I/O stack would lead to severe performance degradations on manycore platforms incorporating fast storage technologies (e.g., non-volatile memories). This talk presents MultiLanes, a virtualized storage system for OS-level virtualization on many cores. Multi-Lanes builds an isolated I/O stack on top of a virtualized storage device for each VE to eliminate contention on kernel data structures and locks between them, thus scaling them to many cores. Moreover, the overhead of storage device virtualization is tuned to be negligible so that MultiLanes can deliver competitive performance against Linux. Apart from scalability, MultiLanes also delivers flexibility and security to all the VEs, as the virtualized storage device allows each VE to run its own guest file system. The evaluation of our prototype system built for Linux container (LXC) on a 16-core machine with a RAM disk demonstrates MultiLanes outperforms Linux by up to 11.32X and 11.75X in micro- and macro-benchmarks, and exhibits nearly linear scalability.

报告人简介

Junbin Kang is a fifth-year Ph.D. in Computer Science Department at Beihang University. He obtained his B.S. from Beihang University in 2009. His current research interests center on operating systems, storage systems and virtualized systems, with a special focus on improving scalability and performance of system software, and building new systems on emerging hardware.





赞助商报告



报告1:曙光大数据存储和处理优化技术

报告摘要

在大数据应用中,面临着数据量大、种类繁多、快速响应等多方面的挑战,而影响系统I/O和计算性能的关键因素依然是数据的存储组织、访问方式和处理方式这几个方面。本报告从曙光大数据系统的存储组织与划分,并行作业执行控制,数据传输优化等几个方面,探讨大数据存储和处理优化技术,提高大数据系统的性能和可靠性。

报告人简介

宋怀明,博士,高级工程师,现任曙光信息产业(北京)有限公司大数据研发部经理。 主要研究方向为海量数据存储和处理技术,2009年博士毕业于中国科学院计算技术研究所。2009~2011年间,在美国伊利诺伊理工大学和美国阿贡国家实验室从事博士后研究,在国际会议SC、HPDC、CCGRID、CLUSTER、ISPA、PDSW等以第一作者发表论文十多篇。2011年8月加入曙光公司,担任大数据研发经理和技术方向负责人,从事大数据产品的研发工作。主持研发了曙光海量结构化数据处理系统DRAC产品,曙光XData大数据一体机,曙光XData-Hadoop发行版软件,负责曙光大数据产品的技术规划和总体设计。所研制的大数据产品广泛应用在了新媒体、安全、金融、电信等行业,取得了良好的社会效益和经济效益。此外,作为项目负责人和技术骨干,承担和参与了863项目、发改委信息安全专项、北京市十百千工程等重大科研项目的研发工作。


报告2:百度新存储体系的发展和演化

报告摘要

百度从2010年起开始规划新存储体系以来,已历时四年,发展至今的新存储体系包含了三个子系统,支撑了包括百度网页库、百度网盘在内的数百个应用、数百P数据的存储需求。本次报告将向大家介绍,百度的新存储体系是如何随着需求,以及百度软硬件环境的变迁而发展和演化的。

报告人简介

曹乐,基础架构部架构师,分布式文件系统方向与弹性块存储方向技术负责人,专注分布式存储领域。


报告3::华为OceanStor9000分布式存储文件系统的架构和演进

报告摘要

  • 华为存储及OceanStor 9000
  • 华为分布式文件系统WushanFS v1.0
  • 华为分布式文件系统WushanFS v2.0
  • 未来演进思考

报告人简介

程菊生,男,1998年浙江大学博士毕业。从2001年起一直从事分布式存储系统的研究和开发,先后成功完成多个分布式系统的设计和开发。

【个人简历】

  • 2001年7月-2004年5月,联想研究院,服务器和存储研究室主任,资深研究员,主要从事文件系统、NAS、集群系统的研究和开发,主导研发了联想“万亿次超级计算机”,峰值速度当年世界排名第七。
  • 2004年5月-2008年9月,NEC美国研究院,存储技术专家,研发了世界上第二款基于重复数据删除和Erasure code的CAS归档存储系统HydraStor,实现了集群文件系统、重复数据删除、节点间RAID、内容寻址等重要功能。
  • 2008年10-今,华为IT架构与设计部,存储技术专家,先后担任了华赛的云存储系统CloudStor架构师、华赛P2P存储系统的架构师、OceanStor 9000架构师,主导完成分布式存储系统关键技术的设计和开发。 2013年8月起担任IT产品线分布式中间件TMG主任。

【研究/学术成果】:省部级和国家级奖励,3次
        √2003年,获北京科学技术进步一等奖 (排名第6)
        √2004年,获国家科学技术进步二等奖 (排名第6)
        √2013年,获广东科学技术进步二等奖 (排名第3)
        √个人发明专利32项(全部是第一发明人)


报告4:Software Defined Storage - Open Framework and Intel® Architecture Technologies

报告摘要

Software Defined Storage (SDS) has significant impact on how companies deploy and manage public and private cloud storage solutions to deliver on-demand storage services while reducing the cost. Similar to Software Defined Networking (SDN), SDS promises to simplify management of diverse storage solutions and ease of use. However in order to deliver this promise, there is a need for open framework for delivering distributed storage solutions on standard high volume servers and addressing management pain points for different storage systems in the data center. This presentation outlines open SDS framework, Intel silicon, software technologies and open source initiatives for deploying software defined storage solutions.

报告人简介

段建钢,英特尔亚太研发公司云计算与大数据基础架构实验室经理,在企业级服务器应用测试及性能优化方面拥有超过10年的丰富经验,参与多代英特尔处理器的性能优化工作,并和多家原始设备制造商(OEM)合作完成创纪录的测试发布。当前主要从事在云计算和大数据技术的研究,负责基于ceph, OpenStack and apache spark等开源软件的开及优化,并和合作伙伴一起致力于推进中国云计算生态系统的发展。在加入英特尔前,建钢在1999年毕业于清华大学电子工程系,并在2001获得工学硕士学位。


报告5:Software Defined Storage - Open Framework and Intel® Architecture Technologies

报告摘要

根据摩尔定律,全球的数据每个18个月翻一番。我们处于数据信息爆发的年代,互 联网技术、云计算、大数据技术不断突破并发展成熟。与此同时,闪存技术的兴起,为大数据时代科技的进一步发展,提供了高效的底层基础平台支持,大大加速了 数据应用平台的优化整合,为各种新的技术和方案的开发和应用提供了可能。本次演讲通过Memblaze公司的发展和产品技术的简介,重点讲解了数据量爆炸 的时代,闪存相关技术的发展和方案应用,并通过最新的闪存技术发展介绍,来展望在未来的科技领域中闪存技术的应用方向和前景。

报告人简介

张泰乐,2006年,中科院声学所 信号与信息处理专业博士毕业。于2014年3月加入memblaze,任技术合作高级总监。此前在国际开源组织linaro任职主任工程师,intel 任职资深云架构师。