基本信息
王勇  男  博导  中国科学院数学与系统科学研究院
电子邮件: ywang@amss.ac.cn
通信地址: 北京市海淀区中关村东路55号
邮政编码: 100190

研究领域

最优化理论与算法

生物信息学

系统生物学

统计学习

运筹学理论与应用


融合最优化、动力系统、统计观点建模多源异质动态海量生物医学数据,提炼数学理论和算法,解决生物医学中的关键问题,并提炼出数学研究中的新的理论问题。


(1) 重点研究生物分子网络建模,在数学上找出产生数据的模型,揭示生物学家关心的因果关系。

(2) 重点研究生物医学数据分析集成,在数学上研究生物医学数据的基本数学结构,通过建模分离信号与噪声。

招生信息

   
招生专业
070105-运筹学与控制论
071400-统计学
081203-计算机应用技术
招生方向
最优化理论与算法,系统生物学,数据科学与大数据建模
统计学习,生物医学统计,大数据分析建模
生物信息学

教育背景

2002-09--2005-05   中国科学院数学与系统科学研究院   博士
1999-09--2002-09   大连理工大学应用数学系   硕士
1995-09--1999-09   内蒙古大学数学系   本科
学历

-- 研究生

学位
-- 博士

工作经历

   
工作简历
2020-05~现在, 中国科学院大学杭州高等研究院, 研究员
2018-01~现在, 中国科学院动物进化与遗传前沿交叉卓越创新中心, 骨干人才
2017-02~现在, 中国科学院数学与系统科学研究院应用数学研究所, 研究员
2012-11~2016-02,美国斯坦福大学, 访问学者
2010-10~2011-04,日本产业技术综合研究所计算生物研究中心, 特别研究员
2010-04~2017-02,中国科学院数学与系统科学研究院应用数学研究所, 副研究员
2007-09~2008-09,美国波士顿大学, 访问学者
2007-06~2010-03,中国科学院数学与系统科学研究院应用数学研究所, 助理研究员
2005-10~2007-03,日本大阪产业大学电子情报通信系, 日本文部省奖学金资助博士后
2005-05~2007-06,国家信息中心, 博士后
社会兼职
2017-01-01-2021-12-31,工业与应用数学学会大数据人工智能专业委员会, 专委
2017-01-01-2021-12-31,中国生物化学与分子生物学会分子系统生物学专业委员会, 专委
2017-01-01-2021-12-31,中国人工智能学会生物信息学与人工生命专业委员会委员, 专委
2017-01-01-2022-12-31,Associate Editor of BMC Systems Biology, Associate Editor
2016-01-01-2020-12-31,中国运筹学会青年工作委员会, 秘书长
2012-08-31-2020-12-31,中国运筹学会副秘书长, 副秘书长
2011-08-27-2020-12-31,中国运筹学会计算系统生物学分会, 秘书长

教授课程

数据分析与优化建模
计算基因组学
生物信息学与计算系统生物学
生物信息学与系统生物学

专利与奖励

   
奖励信息
(1) 网络化生物大数据挖掘理论与方法, 二等奖, 部委级, 2017
(2) 中国科学院数学与系统科学研究院突出科研成果奖, 特等奖, 研究所(学校), 2016
(3) 第21届国际基因组信息学大会(GIW 2010)最佳张贴论文奖, 特等奖, 其他, 2010
(4) 中国科学院数学与系统科学研究院突出科研成果奖, 特等奖, 研究所(学校), 2008
(5) 中国科学院数学与系统科学研究院院长奖学金特等奖, 特等奖, 研究所(学校), 2004
专利成果
( 1 ) 基于生物医学大数据的生物标记物组合识别方法和系统, 发明, 2017, 第 1 作者, 专利号: 201410001304X
( 2 ) 一种在高维数据中快速识别特征组合的方法及系统, 发明, 2016, 第 1 作者, 专利号: 2014100014610
( 3 ) 一种预测药物的蛋白质相互作用靶点的方法和系统, 发明, 2015, 第 2 作者, 专利号: 2015106454214
( 4 ) 一种药物的长非编码RNA靶点预测方法和系统, 发明, 2020, 第 2 作者, 专利号: 2016105427341

出版信息

   
发表论文
(1) ZokorDB: tissue specific regulatory network annotation for non-coding elements of plateau zokor., Quantitative Biology, 2020, 通讯作者
(2) Time course regulatory analysis based on paired expression and chromatin accessibility data., Genome Research, 2020, 通讯作者
(3) Associating divergent lncRNAs with target genes by integrating genome sequence, gene expression and chromatin accessibility data., NAR Genomics and Bioinformatics, 2020, 通讯作者
(4) 3SCover: Identifying safeguard TF from cell type-TF network by an extended minimum set cover model, iScience, 2020, 通讯作者
(5) Identifying cell type specific TF combinatorial regulation via a two-stage statistical model, IEEE International Conference on Big Data and Smart Computing (BigComp), 2020, 通讯作者
(6) TFAP2Cand p63-Dependent Networks Sequentially Rearrange Chromatin Landscapes to Drive Human Epidermal Lineage Commitment., Cell Stem Cell, 2019, 第 2 作者
(7) Lipid-gene regulatory network reveals coregulations of triacylglycerol with phosphatidylinositol/ lysophosphatidylinositol and with hexosyl-ceramide., BBA - Molecular and Cell Biology of Lipids, 2019, 通讯作者
(8) Multi-level comparative framework based on gene pair-wise expression across three insulin target tissues for type 2 diabetes., Frontiers in Genetics, 2019, 通讯作者
(9) Systems biology intertwines with single cell and AI, BMC Bioinformatics, 2019, 第 1 作者
(10) Hierarchical graphical model reveals HFR1 bridging circadian rhythm and flower development in Arabidopsis thaliana., npj Systems Biology and Applications, 2019, 通讯作者
(11) DC3 is a method for deconvolution and coupled clustering from bulk and single-cell genomics data., Nature Communications, 2019, 第 4 作者
(12) scTIM: Seeking Cell-Type-Indicative Marker from single cell RNA-seq data by consensus optimization., Bioinformatics, 2019, 通讯作者
(13) Associating lncRNAs with small molecules via bilevel optimization reveals cancer-related lncRNAs., PLoS Computational Biology, 2019, 通讯作者
(14) Integrating distal and proximal information to predict gene expression via a densely con-nected convolutional neural network, Bioinformatics, 2019, 通讯作者
(15) Integrative analysis of single cell genomics data by coupled nonnegative matrix factorizations., PNAS, 2018, 第 8 作者
(16) ELF: Extract Landmark Features by optimizing topology maintenance, redundancy, and specificity, IEEE/ACM Transactions on Computational Biology and Bioinformatics., 2018, 通讯作者
(17) Revealing transcription factor and histone modification co-localization and dynamics across cell lines by integrating ChIP-seq and RNA-seq data, BMC Genomics, 2018, 通讯作者
(18) Modeling gene regulation from paired expression and chromatin accessibility data, PNAS, 2017, 通讯作者
(19) Models of global gene expression define major 1 domains of cell type and tissue identity, Nucleic Acids Research, 2017, 第 10 作者
(20) Drosophila TRF2 and TAF9 regulate lipid droplet size and phospholipid fatty acid composition, PLoS Genetics, 2017, 第 7 作者
(21) A Novel Dual Eigen-Analysis of Mouse Multi-Tissues’ Expression Profiles Unveils New Perspectives into Type 2 Diabetes, Scientific Report, 2017, 第 4 作者
(22) Modeling the causal regulatory network by integrating chromatin accessibility and transcriptome data, National Science Review, 2016, 第 1 作者
(23) Identifying joint biomarker panel from multiple level dataset by an optimization model, Biomarkers in Medicine, 2016, 通讯作者
(24) A systematic method to identify modulation of transcriptional regulation via chromatin activity reveals regulatory network during mESC differentiation, Scientific Report, 2016, 通讯作者
(25) An extended particle swarm optimization method for folding protein on triangle lattice, IET Systems Biology, 2016, 第 4 作者
(26) Simultaneous dimension reduction and adjustment for confounding variation, PNAS, 2016, 第 6 作者
(27) Computational probing protein–protein interactions targeting small molecules, Bioinformatics, 2016, 通讯作者
(28) NCC-AUC: an AUC optimization method to identify multi-biomarker panel for cancer prognosis from genomic and clinical data, Bioinformatics, 2015, 通讯作者
(29) A novel mixed integer programming for multi-biomarker panel identification by distinguishing malignant from benign colorectal tumors, Methods, 2015, 通讯作者
(30) Identifying network biomarkers based on protein-protein interactions and expression data, BMC Medical Genomics, 2015, 通讯作者
(31) Development of serum parameters panels for the early detection of pancreatic cancer, International Journal of Cancer, 2014, 通讯作者
(32) Network predicting drug anatomical therapeutic chemical code, Bioinformatics, 2013, 通讯作者
(33) ellipsoidFN: a tool for identifying a heterogeneous set of cancer biomarkers based on gene expressions, Nucleic Acids Research, 2013, 第 1 作者
(34) Network-Based Drug Repositioning, Mol. BioSyst., 2013, 通讯作者
(35) iPcc: a novel feature extraction method for accurate disease class discovery and prediction., Nucleic Acids Research, 2013, 第 1 作者
(36) A New Framework for Repositioning Drugs by Incorporating Various Functional Information, IET Systems Biology, 2013, 通讯作者
(37) Bioinformatics studies on induced pluripotent stem cell, Current Bioinformatics, 2013, 第 1 作者
(38) Revealing metabolite biomarkers for acupuncture treatment by linear programming based feature selection, BMC Systems Biology, 2012, 第 1 作者
(39) A unified computational model for revealing and predicting subtle subtypes of cancers, BMC Bioinformatics, 2012, 通讯作者
(40) A combinatorial model and algorithm for globally searching community structure in complex networks, Journal of Combinatorial Optimization, 2012, 通讯作者
(41) Community structure detection based on Potts model and network spectral characterization, Europhysics Letters, 2012, 第 2 作者
(42) A combinatorial model and algorithm for globally searching community structure in complex networks, Journal of Combinatorial Optimization, 2010, 第 4 作者
(43) Network-based analysis of complex, IET Systems Biology, 2010, 第 2 作者
(44) Prediction of protein-RNA binding sites by a random forest method with combined features, Bioinformatics, 2010, 第 3 作者
(45) Identifying dysfunctional crosstalk of pathways in various regions of Alzheimer disease brains, BMC Systems Biology, 2010, 第 2 作者
(46) Computationally probing drug-protein interactions via support vector machine, Letters In Drug Design and Discovery, 2010, 第 3 作者
(47) SANA: an algorithm for sequential and non-sequential protein structure alignment, Amino Acid, 2010, 第 3 作者
(48) Protein evolution in yeast transcription factor subnetworks, Nucleic Acids Research, 2010, 第 1 作者
(49) Optimization meets systems biology, BMC Systems Biology, 2010, 第 1 作者
(50) Identifying translation initiation sites in prokaryotes using support vector machine, Journal of Theoretical Biology, 2010, 第 3 作者
(51) A Linear Programming Framework for Inferring Gene Regulatory Networks by Integrating Heterogeneous Data, Chapter XIX in Computational Methodologies in Gene Regulatory Networks, 2009, 第 1 作者
(52) Evaluating protein similarity from coarse structures, IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2009, 第 1 作者
(53) Predicting eukaryotic transcriptional cooperativity by Bayesian network integration of genome-wide data, Nucleic Acids Research, 2009, 第 1 作者
(54) A network biology study on circadian rhythm by integrating various omics data, OMICS: A Journal of Integrative Biology, 2009, 第 1 作者
(55) Analysis on multi-domain cooperation for predicting protein-protein interactions, BMC Bioinformatics, 2008, 第 2 作者
(56) Inferring transcriptional regulatory networks from high-throughput data, Bioinformatics, 2007, 第 1 作者
(57) Supervised Inference of Gene Regulatory Networks by Linear Programming, Lecture Notes in Bioinformatics, 2006, 第 1 作者
(58) Inferring gene regulatory networks from multiple microarray datasets, Bioinformatics, 2006, 第 1 作者
(59) Exploring protein optimal HP configurations by self-organizing mapping, Journal of Bioinformatics and Computational Biology, 2005, 第 2 作者
发表著作
(1) Operations Research 50周年纪念特刊中文译本, 运筹与管理, 2004-01, 第 5 作者
编制软件

利用最优化模型和算法确定性地对生物数据进行建模,设计算法,编制软件,为生物学家提供了有效、快速、易用的软件工具,促进产生新的发现。代表性软件包括 (https://github.com/AMSSwanglab/ or http://doc.aporc.org/wiki/Software).

 1. Coupled NMF(coupled Nonnegative Matrix Factorizations 集成单细胞染色质可及性数据与转录组数据的耦合聚类软件) 

2. PECA (Paired Expression and Chromatin Accessibility data analysis: 集成染色质状态数据的基因调控网络建模软件) 

3. GRNInfer (Gene Regulatory Network Inference Tool: 基于最优化模型的基因调控网重构软件) 

4. GNTInfer (Gene Regulatory Network Reconstruction Tool with compound Targets: 基于稀疏优化的考虑靶点的基因调控网重构软件) 

5. TRNInfer (Inferring transcriptional regulatory networks from high-throughput data: 基于线性规划的转录调控网重构软件) 

6. DeterminePPI (Inferring protein-protein interactions by parsimony principle: 基于线性规划的蛋白质相互作用网重构软件) 

7. MDCinfer (Inferring protein-protein interactions based on multi-domain Cooperation: 基于线性规划的考虑多结构领域的蛋白质相互作用网重构软件) 

8. MNAligner (Molecular Network Aligner: 基于二次规划的分子生物网络的比对软件) 

9. OTCC (An Optimization Model for Fuzzy Binary Clustering: 基于最优化模型的聚类软件) 

10. NOA (Network Ontology Analysis:基于最优化模型的网络功能分析软件) 

11. SAMO (Structure Alignment by Multi-objective Optimization: 基于多目标规划的蛋白质结构比对软件) 

12. LPFS (Linear Programming based Feature Selection: 基于线性规划的特征选择软件) 

13. ellipsoidFN (a tool for identifying heterogeneous biomarkers: 非冗余特征选择的优化软件) 

14. NetPredATC (Network predicting drug's ATC code: 基于网络预测药物标签) 

15. NCC-AUC (Nearest Centriod Classifier for AUC valuation:基于线性规划的生存时间生物标记物识别软件) 

16. MOCHA (MOdulation of transcriptional regulation via CHromatin Activity:基于Bayesian图模型的调控网络重建软件) 

17. PreDR (Predict Drug Repositioning:基于数据集成的药物重定位软件) 

18. PrePPItar (Machine learning framework to Predict PPI target for drug:药物的蛋白质相互作用靶点预测) 

19. MILP_k (Mixed Integer Linear Programming for multiple-biomarker panel identification:生物组合标记物识别的混合整数规划软件) 

20. DGPsubNet (Drug-Gene-Disease coherent SUBNETworks:药物-基因-疾病子网络识别软件)

21. QMC (A combinatorial model and algorithm for globally searching community structure: 复杂网络模块探测算法)

科研活动

   
科研项目
( 1 ) 基因调控网络重建中的优化模型和算法研究, 主持, 国家级, 2009-01--2010-12
( 2 ) 基因调控网络研究, 主持, 国家级, 2011-01--2011-12
( 3 ) 基于条件随机场的生物信息学研究, 参与, 国家级, 2010-01--2011-12
( 4 ) 最优化方法在信息技术中的应用, 参与, 部委级, 2009-01--2011-12
( 5 ) 诱导多能干细胞的生物信息学研究, 主持, 国家级, 2012-01--2015-12
( 6 ) 生物医学大数据的数学建模, 主持, 国家级, 2015-01--2017-12
( 7 ) 动物复杂性状的进化解析与调控, 主持, 部委级, 2014-12--2019-12
( 8 ) 网络化知识的基础理论与应用, 参与, 国家级, 2017-01--2022-12
( 9 ) 集成染色质状态和表达数据的基因调控网络建模, 主持, 国家级, 2017-01--2020-12
( 10 ) 复杂网络的最优化方法及在系统生物学的应用, 参与, 国家级, 2012-01--2016-12
( 11 ) 中国重大疾病与罕见病临床与生命组学数据库, 参与, 国家级, 2018-01--2021-12
( 12 ) 干细胞增殖的计算建模及其在癌症演变动力学的应用, 参与, 国家级, 2018-01--2019-12
( 13 ) 癌症基因组大数据深度分析中的优化建模和算法研究, 参与, 国家级, 2017-01--2019-12
( 14 ) 阐明遗传变异的调控网络数据建模, 主持, 国家级, 2019-01--2022-12
( 15 ) 基因型与表型的因果调控网络建模, 参与, 国家级, 2018-01--2020-12
( 16 ) 灵长类大脑进化发育研究, 参与, 部委级, 2019-01--2021-12
参与会议
(1)Interpreting genetic variant by constructing tissue specific regulatory network   2019-10-31
(2)Statistical model for tissue specific regulatory network inference   2019-09-01
(3)基因调控网络重建的最优化模型与算法   中国运筹学会第十四次学术年会   2018-10-12
(4)Optimization model and algorithm for regulatory network   2018-09-20
(5)基因表达与染色质开放数据集成建模方法   计算表冠遗传学大数据前沿学术论坛   2018-08-04
(6)计算系统生物学的基因调控网络研究   全国大数据与人工智能科学大会   2018-07-07
(7)Tissue specific regulatory network for complex disease   2018-06-20
(8)生物分子网络的数学建模与算法   中国数学学会2017年会   2017-10-26
(9)生物大数据的降维优化模型和生物标记物发现   中国工业与应用数学学会2017年会   2017-10-12
(10)Predicting protein-protein interaction network   Yong Wang   2010-05-11

合作情况

   
合作单位

  1. 美国斯坦福大学NIH 基因组学卓越中心—个性化动态调控组中心 (Center for Personal Dynamic Regulomes)
  2. 中国科学院动物进化与遗传前沿交叉卓越创新中心

  3. 中国科学院上海生命科学研究院
  4. 中国科学院上海生化细胞所
  5. 中国科学院昆明动物所
  6. 中国解放军总医院
  7. 成都中医药大学
  8. 清华大学

指导学生

已指导学生

张朝昱  硕士研究生  070105-运筹学与控制论  

陈浪  硕士研究生  070105-运筹学与控制论  

信晶雪  博士研究生  070105-运筹学与控制论  

都仁扎那  博士研究生  070105-运筹学与控制论  

现指导学生

朱炜康  硕士研究生  070105-运筹学与控制论  

马朝霞  硕士研究生  070105-运筹学与控制论  

苑秋月  博士研究生  070105-运筹学与控制论  

孙昕琦  硕士研究生  070105-运筹学与控制论  

冯占营  博士研究生  070105-运筹学与控制论