职责描述:
1.针对药物晶体筛选流程中产生的诸多数据设计、开发并维护混合型分布式数据存储系统;
2.对上述存储系统构建高效的数据挖掘框架与工具;
3.设计并开发对接数据挖掘过程的API,供业务分析人员、科学团队、工程团队使用。
任职要求:
1.本科及以上学历,计算机科学、统计学、运筹学、数学等相关专业;
2.1年以上的数据挖掘/最优化算法/机器学习等相关领域的开发经验;
3.有过大型分布式系统架构设计与实践者优先;
4.熟练使用Python/C++/C/Golang/Node.js,或至少一种编程语言进行数据工程开发;
5.熟悉至少一种分布式计算框架或流式计算框架,例如Hadoop、Spark、Flink等;
6.了解至少一种机器学习框架,例如TensorFlow、MXNet、PyTorch、Caffe等;
7.了解至少一种云服务平台的大数据架构解决方案;
8.有较强的分析及解决问题的能力。