2021年核酸研究Web Server专刊发表89篇文章,7篇源自中国,AI和多组学凸显
核酸研究除了众所周知的每年初的数据库专刊外,每年中还发表一期Web服务专刊,收集在线数据分析服务。本期(2021年度)NAR团队共收到297项Web Server相关的提交,接收89项(占30%),包括88个网络服务器(web server)和1个单机工具(stand-alone tool)。文末附整理后的列表。
核酸研究并没有将这89篇文章进行分类,我们根据自己的判断,将这些文章按所涉及的研究领域分为6大类:组学(包括基因组、转录组、蛋白质组、代谢组、多组学),理化性质和结构,功能分析,药物研究,基因工程,以及部分研究辅助性工具。其中有些工具涉及多个领域,这里暂且按个人理解的偏向性进行归类,只为协助读者系统梳理所有的文章,并快速定位到自己感兴趣的web服务工具。由于生物学研究的各个方面都涉及到基因、表达等信息,因此,组学相关的工具多,共36篇。其中包括基因组(14篇)、转录组(6篇)、蛋白质组(5篇)、代谢组(5篇)、多组学联合分析(6篇)。其次是理化性质和结构方面的研究工具(29篇),以及功能方面的研究工具(10篇)。结构和功能往往是密不可分的,我们把涉及到空间结构的部分归为结构类型的文章,把只涉及到基因功能注释和关联等分析的归为功能类型。药物(3篇)和基因工程工具(5篇)这两个部分加起来约占一成。药物研究的工具主要是预测和药物设计,以及药物敏感性数据仓库。基因工程工具主要是CRISPR相关工具2篇,另外3篇分别和工程质粒、引物和限制性酶有关。还有4篇研究辅助性工具,包括监测网页服务的可及性的Aviator ,计算平台相关的Docker工具商店,生物学网络算法指南(Graphery ),以及NCBI提供的文献推荐工具(LitSuggest )。另外2篇无法归入上述各个类型,作为“其它”单列,分别是COVID-19数据仓库,以及细胞增值分析和可视化的Thunor 。
不同类别文章数目
中国大陆和港澳台的科研院所贡献了其中7篇文章,其中中国大陆有6篇,台湾有一篇,如下:
北京大学2篇:包括用于基因表达分析的GEPIA2021 和用于功能分析的KOBAS-i 。清华大学1篇:开发了用于染色质可及性注释的OpenAnnotate 。上海交通大学1篇:开发了NetGO 2.0 ,用于蛋白功能预测。华中农业大学1篇:提供的PlantDeepSEA 用于植物遗传变异调控效应预测。由中南大学、浙江大学和国防科技大学三个团队合作开发的ADMETlab 2.0 主要应用于药物研究。此外,中國醫藥大學(台湾)提供的LipidSig 用于脂质组分析。
与人工智能技术相关的文章有19篇。涉及基因的功能注释、基因与表型的关联,以及对结构和位点的分析等。其中,采用机器学习的有11篇,深度学习8篇。深度学习在蛋白质结构和位点研究中应用相对较多。
机器学习相关应用

深度学习相关应用

NAR团队还随专刊提出了2022年的进一步改良计划,主要针对用户的访问和安全性等,收紧cookie政策,不希望研究人员被跟踪,仅在网站功能需要时才允许使用第三方cookie。
对敏感的非公开人类数据(例如来自WES、WGS、WTS或SNP阵列的基因型)取消“no login”要求以支持安全性。但必须可以在没有任何身份证明(姓名或电子邮件地址)的情况下进行注册。
如果Web服务器处理敏感的人类数据,强制使用https。
核酸研究的web server专刊为我们提供了web服务工具的盛宴,其中组学相关的工具占大部分,多组学数据整合分析逐步提上日程。使用AI相关的工具超过了二成,涉及到多个领域的研究工具。
附表:
名称 | 分类 | 描述 |
antiSMASH 6.0 | 基因组 | 细菌和真菌的生物合成基因cluster的检测和识别 |
CNVxplorer | 基因组 | CNV的临床解释 |
DGLinker | 基因组 | 疾病基因关联的表型预测 |
EDGAR3.0 | 基因组 | 微生物基因组比较 |
iTOL v5 | 基因组 | 系统树展示和注释 |
Mechnetor | 基因组 | 遗传变异浏览和功能 |
MutationTaster2021 | 基因组 | 预测潜在的DNA变异 |
OpenAnnotate | 基因组 | 染色质可接近性注释 |
PlantDeepSEA | 基因组 | 植物遗传变异调控效应预测 |
snpXplorer | 基因组 | 人类SNP注释和浏览 |
Vaxign2 | 基因组 | 疫苗设计软件 |
Estimage | 基因组 | 利用表观遗传学时钟计算甲基化年龄 |
G2PDeep | 基因组 | 表型预测和遗传标记的发掘 |
DeepFun | 基因组 | 预测非编码变异效应 |
eSkip-Finder | 转录组 | 外显子跳跃的反义寡核苷酸设计 |
eVITTA | 转录组 | 转录组分析工具 |
miRMaster 2.0 | 转录组 | 多物种非编码RNA测序分析 |
ncFANs v2.0 | 转录组 | 非编码RNA的功能注释 |
Trips-Viz | 转录组 | 核糖体谱 |
miRTargetLink2 | 转录组 | miRNA靶基因和靶通路网络 |
GPCRsignal | 蛋白质组 | G蛋白偶联受体及其效应蛋白 |
PERCEPTRON | 蛋白质组 | Top-down蛋白体鉴定流程 |
PredictProtein | 蛋白质组 | 蛋白质结构和功能预测 |
ProteoSign v2 | 蛋白质组 | 差异蛋白质组分析 |
TISIGNER.com | 蛋白质组 | 重组蛋白产物的改善 |
gutSMASH | 代谢组 | 肠道微生物的基础代谢基因簇鉴定 |
LipidSig | 代谢组 | 脂质组 |
LipidSuite | 代谢组 | 脂质组差异和富集分析 |
MetaboAnalyst 5.0 | 代谢组 | 代谢组数据分析和解析 |
ProLint | 代谢组 | 脂-蛋白相互作用 |
catRAPID omics v2.0 | 多组学 | 蛋白-RNA相互作用预测 |
iNetModels 2.0 | 多组学 | 多组学数据可视化和数据库 |
Mergeomics 2.0 | 多组学 | 多组学和疾病网络 |
OmicsAnalyst | 多组学 | 多组学数据分析 |
SynLeGG | 多组学 | 多组学数据分析发掘癌的“阿喀琉斯之踵” |
TIMEOR | 多组学 | 多组学数据发掘时间调控机制 |
Amino Acid Interactions (INTAA) v2.0 | 结构 | 生物大分子3D结构能量和保守性计算 |
AnnotSV & knotAnnotSV | 结构 | 人类结构变异的注释 |
b2bTools | 结构 | 蛋白的生物物理特征和保守性预测 |
BENZ WS | 结构 | 酶的EC号注释 |
BRIO | 结构 | RNA序列和结构的预测 |
CeLaVi | 结构 | 细胞谱系可视化 |
CheckMyBlob | 结构 | 配体的识别和验证 |
DeepRefiner | 结构 | 蛋白质结构优化 |
DoChaP | 结构 | 比较异构体间的蛋白质结构域 |
DomainViz | 结构 | 蛋白群之间的保守结构域分布 |
GalaxyHeteromer | 结构 | 蛋白质异源二聚体结构预测 |
InterEvDock3 | 结构 | 蛋白质对接 |
IUPred3* | 结构 | 非结构蛋白预测 |
LZerD | 结构 | 蛋白质对接预测 |
mmCSM-PPI | 结构 | 在蛋白质相互作用中多点突变的效应 |
ModFOLD8 | 结构 | 蛋白3D模型的质量评估 |
Mol* Viewer | 结构 | 生物大分子结构的3D可视化和分析 |
MTR3D | 结构 | 在蛋白3D结构中鉴定负选择区域 |
MyCLADE | 结构 | 多源结构域注释 |
OxDNA.org | 结构 | DNA和RNA的纳米级结构 |
PLIP2021 | 结构 | 蛋白-配体相互作用谱 |
ProteinTools | 结构 | 蛋白质结构分析工具集 |
ProteoVision | 结构 | 核糖体蛋白的可视化 |
ReFOLD3 | 结构 | 蛋白质3D结构优化 |
RunBioSimulations | 结构 | 计算建模平台 |
VirtualTaste | 结构 | 机器学习预测味道 |
Voronoia 4-ever | 结构 | 大分子内压缩密度计算 |
ProteinLens | 结构 | 生物分子原子图的变构信号分析 |
IPC 2.0 | 结构 | 利用深度学习预测等电点和pKa解离常数 |
Arena3Dweb | 功能分析 | 多层网络的3D可视化 |
CoffeeProt | 功能分析 | 遗传数据富集分析 |
CPA | 功能分析 | 共有通路分析 |
DeepGOWeb | 功能分析 | 蛋白质功能预测 |
Expasy | 功能分析 | Expasy结构功能分析工具汇总 |
GEPIA2021 | 功能分析 | 基因表达分析 |
KEA3 | 功能分析 | 激酶富集分析 |
KOBAS-i | 功能分析 | 功能分析 |
NetGO 2.0 | 功能分析 | 蛋白功能预测 |
Proteo3Dnet | 功能分析 | 蛋白质组相互作用组实验分析 |
CRISPRloci | 基因工程工具 | CRISPR-Cas注释 |
PE-Designer & PE-Analyzer | 基因工程工具 | CRISPR引物编辑 |
pegIT | 基因工程工具 | 引物编辑 |
pLannotate | 基因工程工具 | 工程质粒注释 |
Preselector.uni-jena.de | 基因工程工具 | 限制性酶鉴定 |
ADMETlab 2.0 | 药物研究 | 药物研究工具 |
DrugComb | 药物研究 | 药物敏感性数据仓库 |
LigAdvisor | 药物研究 | 药物设计 |
Aviator | 研究辅助工具 | 监测网页服务的可及性 |
Graphery | 研究辅助工具 | 生物学网络算法的使用 |
LitSuggest | 研究辅助工具 | 文献推荐和注释 |
The Dockstore | 研究辅助工具 | docker商店 |
The COVID-19 Data Portal | 其它 | COVID-19数据存储 |
Thunor | 其它 | 细胞增值分析和可视化 |
网址 :https://academic.oup.com/nar/issue/49/W1
青莲百奥可提供一站式蛋白质组学、代谢组学、转录组学、多组学联合分析等科研服务。青莲百奥在质谱检测方面项目经验丰富,拥有国际质谱平台,海归坐镇专业生信分析团队,助您在科研道路上乘风破浪,冲击高水平文章。更多技术服务敬请来电咨询:010-53395839。