咨询专家

有问题需要获取此专家的专业意见?

电话约谈 10元/分钟

线下约谈 500元/小时

大数据及人工智能专家

大数据及人工智能专家

CTO | 某公司

工作经验:23年城市:北京市

擅长方向

大数据平台架构 | 研发管理 | 机器学习[ 20年工作经验 ]
大数据及人工智能
他,加拿大阿尔伯塔大学人工智能与机器学习博士,在大数据领域已有20年工作经历,现任某大数据公司CTO和首席科学家。

他擅长的领域:
•机器学习, 数据挖掘
•大数据运维 (Hadoop, Mahout, Storm, Kafka, Cassandra, Zookeeper, Docker, Graphite)
•并行运算/GPU运算, 计算机群&云平台 (SGE, SLURM, AWS)
•生物信息工程, NGS 基因数据分析
•移动机器人
•嵌入式系统

他擅长的编程语言与技术:
•编程语言:C/C++/C#, CUDA/OpenCL, MPI/OpenMP, Perl, Python, Java, Shell/Bash, R
•数据库: SQL, PostgreSQL, Cassandra
•软件管理:Github, SVN, Jira, Confluence, Unfuddle
•大数据: Hadoop, Mahout, Slurm, Storm, Kafka, Zookeeper, Docker, Graphite, Maven, Clojure, Leiningen, sbt, Vagrant, Play!, Gradle.

曾负责重要项目:
•CUDA计算机群:成功搭建了一个LINUX Ubuntu私有云,这套云计算系统多个GPU服务器集成,由SLURM系统管理。这个私有云具有当今世界上最快的大规模多线程运算速度, 特别适用于深度机器学习算法。利用此云平台, 机器学习训练大数据集的速度得到大规模提高,这项工作在GTU2013年会上专门被提及。

•实时数据解析平台:设计开发了针对海量数据的实时数据解析平台, 本平台采用最新的大数据技术, 如Storm, Zookeeper, Kafka, Cassandra, Docker, Graphite等。

•统计数学模型检验和预测基因突变:设计独立编写了一套用多种编程语言(C++, Perl, Python, Bash, PostgreSQL)的数据处理系统专门应用于高性能计算机群上,设计了一套统计数学模型检验和预测基因突变,查找受影响染色体基因。

•基因表达水平检测:设计统计模型分析应用药物后不同阶段的老鼠样本数据,辨别药物应用后不同的基因表达水平。

•机器学习算法预测赛马模型:利用机器学习算法设计一套在线赛马模型,发明了一套全新的数据变量提取系统。

•自主机器人导航:利用多种机器学习算法(回归,支持向量机,神经网络,基因算法, 分类机系统, 加强学习, 模糊系统) 设计自主机器人智能导航系统。发明一种全新的机器学习算法 (加强分类机系统) 设计自主机器人导航系统。

•利用人工智能技术解决无线通讯频道转换问题:利用人工智能技术解决无线通讯频道转换问题,编写了一套利用人工智能技术解决无线通信信道分配问题的软件包。

•人工智能技术解决旅行者问题:利用人工智能技术解决组合最优化问题,我应用的混沌淬火算法解决的旅行者问题,其结果是当时世界上最优的,并在IEEE TRANSACTION上发表文章。

欢迎您来大牛家向他提问,请在沟通前将自己的问题具体化、条理化,以便提高效率,获得更好效果。
2015.05 - 至今    (5年5个月)
CTO  |  某公司
大数据平台及应用, 机器学习与数据挖掘
2016.01 - 至今    (4年9个月)
CTO & 首席科学家  |  某公司
架构大数据平台 & 机器学习算法行业应用
2014.12 - 2015.07    (7个月)
首席数据架构师  |  AS
大数据架构
2011.12 - 2014.12    (3年)
资深数据科学家  |  POF
•利用机器学习算法和数据挖掘技术设计及实现在线交友配对预测模型,广告投放预测模型,用户升级系统,用户回信模型。这个配对预测推荐模型应用到在线大规模的提高了配对率,是当前世界上最先进的在线交友推荐系统。
•成功搭建了一个LINUX Ubuntu私有云,这套云计算系统多个GPU服务器集成,由SLURM系统管理。这个私有云具有当今世界上最快的大规模多线程运算速度, 特别适用于深度机器学习算法。利用此云平台, 机器学习训练大数据集的速度得到大规模提高,这项工作在GTU2013年会上专门被提及。
•独立编写了一套用多种编程语言(C/C++, CUDA/openCL, Perl, Python, Bash, R, PostgreSQL)的数据处理系统专门应用于上述的云平台。
•在云平台上搭建了自定义的PostgreSQL数据库用于实时数据处理和挖掘。
•在云平台上搭建了多节点的Hadoop 群用于文字大数据处理。
•设计开发了针对海量数据的实时数据解析平台, 本平台采用最新的大数据技术, 如WEB/Mobile APIs数据 -> Kafka cluster -> Kafka Storm consumer (实时运算) -> Postgres/Cassandra -> reporting (graphite), 用Docker Package。
2007.12 - 2011.12    (4年)
算法科学家  |  GSC
•设计实现算法分析新一代DNA排序基因数据
•设计独立编写了一套用多种编程语言(C++, Perl, Python, Bash, PostgreSQL)的数据处理系统专门应用于高性能计算机群上,设计了一套统计数学模型检验和预测基因突变,查找受影响染色体基因。
•设计统计模型分析应用药物后不同阶段的老鼠样本数据,辨别药物应用后不同的基因表达水平。
•在云平台上搭建了多个PostgreSQL 数据库用于实时数据处理,通过这类数据库,知识型技术就可以成功的应用到生命科学上。
•在“自然”杂志上合作发表文章。