• Resume
  • View photo

科研项目 中科大HILAB(2014.09-2014.12)

Web在线文本挖掘工具:采用Lingpipe实体识别和Dependency trees句法解析的方法,挖掘生物医学文献中一类生物过程。并将模型集成为一个在线的工具。工具地址:http://hi.ustc.edu.cn/mptm。 项目细节:在项目中使用LingPipe做命名实体识别,使用Stanford CoreNLP Parser做句法解析。Web后台使用Perl和MySQL。Web前端使用Javascript, HTML5/CSS3实现。

科研项目 中科大HILAB(2015.01-2015.04)

科学文献中关系实体挖掘:采用LingPipe和基于词典的方法实现实体识别,提取文本特征,人工标定数据集,针对句子中是否包含关系实体这一二分类问题,训练Random forest模型。 项目细节:在项目过程中学习了常用的机器学习算法原理,项目使用Python Scikit-learn。项目成果发表在第十七届IFAC系统与模式识别(SYSID)国际会议和神经计算(Neurocomputing)SCI期刊。

科研项目 中科大HILAB & MCGLAB (合作项目)(2015.07-2016.06)

RNA二代测序数据挖掘:使用序列比对工具SOAP,BLAST, Bowtie构建数据挖掘流程,挖掘2700多组RNA测序数据中miRNA异构体,将结果整合成一个在线数据库:http://mcg.ustc.edu.cn/bsc/isomir 项目细节:在项目中使用ETL预处理测序数据;优化三种序列比对工具,采用多线程加速对比速度,整合结果,构建在线的数据库。项目成果发布在生物信息学顶级期刊Bioinformatics上。

RNA测序数据在线分析工具:对RNA二代测序数据挖掘项目中实现的处理流程,和生物学科研人员合作,根据实际需求,增加数据可视化,筛选等功能,实现一个在线的测序数据分析工具。项目地址:http://mcg.ustc.edu.cn/bsc/deanniso 项目细节:项目中使用Python实现在线工具后端数据处理流程,项目成果发布在顶级期刊Nucleic Acids Research上。

专业技能

个人主页

理论知识

  • 机器学习
  • 文本挖掘
  • 深度学习
  • Spark & Hadoop

编程语言

  • Python
  • Scala
  • Java
  • R
  • Perl
  • HTML/CSS

教育经历

中国科学技术大学 2014.8 - 2017.7

硕士

2014年免试保送到中国科学技术大学,信息科学技术学院,电子科学与技术系学习。研究方向为:文本挖掘,生物信息学,二代测序数据分析,在校期间参与多个科研项目,参与发表学术论文4篇。

安徽大学 2010.8 - 2014.7

学士

2010年考入安徽大学,电子信息工程学院,微电子学专业学习。在校期间获得国家励志奖学金,2013年安徽省大学生电子设计竞赛一等奖,2013年全国大学生电子设计竞赛二等奖等荣誉。

© 2016 Curriculum Vitae All Rights Reseverd | Design by qgzang