蛋白质组学

北京青莲百奥生物科技有限公司

蛋白质诊疗标志物发现创新平台

服务咨询热线

010-53395839

蛋白质组学,糖基化蛋白质组学,多组学联合分析
您当前的位置 : 首 页 > 新闻动态 > 公司新闻

「青莲百奥干货」原始数据上传的那些事!

2021-01-19 00:00:00

蛋白质组学如火如荼的今天,许多科研工作者在进行涉及到蛋白质组学的研究成果的投稿时,编辑一般会要求作者在第三方平台上提交蛋白组学的原始数据(“Public availability of data”)。因此客户宝宝问题就来了:怎么上传原始数据,上传到哪个数据库,都需要上传哪些数据?今天小编就给大家介绍一下原始数据上传的那些事。

原始数据上传到哪?


ProteomeXchange(简称PX),是应用较为广泛的蛋白质组学质谱数据存储平台(http://www.proteomexchange.org),旗下包括了PRIDE Archive, MassIVE, PeptideAtlas, and jPOST等平台,研究者可以根据需要选择通过ProteomeXchange客户端直接上传原始数据或通过旗下平台进行上传。其中iProX是国内的上传蛋白质学质谱数据的存储平台(http://www.iprox.org),因服务器在国内,数据上传的速度相对较快,国内研究者可以选择该平台进行数据提交。

图1.ProteomeXchange以及其旗下平台



上传的原始数据包含哪些内容?



上传的数据集(dataset)一般包括搜索的结果文件、原始质谱数据(Raw data)、实验信息。其中搜索的结果文件为Peptide / protein identification files肽段蛋白质鉴定文件,称为“RESULTS”;原始质谱数据为mass spectrometer output files质谱输出文件,称为“RAW”,既可以是仪器直接输出的raw文件,也可以是高度加工过的XML标准形式(mzXML或mzML)文件。另外还需要上传一些其它参数文件,包括peaklist files文件(称为“PEAK”),search engine output files文件(称为“SEARCH”,是Partial submissions提交时所必须的),quantification files定量文件及其他的后加工的文件等。


数据提交的模式怎样选择?

IProX提供2种数据提交的方式:一种是依赖于搜索结果文件mzIdentML or PRIDE XML的完整提交方式complete submission(也称 “supported”),对数据的格式有要求,适合部分数据;另一种是部分提交方式partial submission(也称“unsupported”),虽然这种模式会明显降低数据的可见度和重复利用度,但因PRIDE访问权限问题及数据分析软件查库结果格式等影响,partial submission为实际数据上传过程中更经常用到的模式,适合所有数据的上传。



数据上传步骤说明

步骤一:注册账号和登录

进入官网https://www.iprox.org/,点击右上角的注册按钮,填写所需的账号名称、密码、用户单位和邮箱等信息,完成后,iProX系统将给用户填写的邮箱发送确认邮件,点击确认链接激活后,即可以使用注册的用户名(UserName)和密码(Password)登陆系统。

完成注册后,点击首页“登录”键进入登录页面(图2),使用注册时填写的用户名和密码,并输入页面显示的验证码即可登录。

图2.登录界面


步骤二:创建新项目

iProX提交系统以项目为数据管理单位的(相当于一次完整的实验研究),一个项目下可以有多个子项目(多次实验结果)。可以认为一个子项目为一个项目下面的一次实验;如果没有重复/对照等不同类型的实验,一个项目下面可以只有一个子项目。

添加新项目的步骤如图3所示。登录系统后,用户可以直接通过首页上方“Project -> New Project”的方式创建新项目。

图3.创建新项目

接着填写创建项目所需的信息,页面中有“*”标记的为必填项,其他内容为选填项。填写完信息后点“Continue”保存当前填写信息进入下一步。

向下滑动查看

640 (2).png

图4.创建项目所需填写信息



步骤三:创建子项目

子项目中大量实验元信息需要通过标准的控制词汇表(CV,Control Vocabulary)进行填写,包括Species、Tissue、Cell type等,点击“Choose”键,在填出的控制词汇表窗口进行条目选择,可以通过常用列表选择条目或者搜索条目进行填写。

向下滑动查看

640 (1).png

图5.创建子项目所需填写信息



步骤四:上传数据文件

iProX系统中数据文件在子项目下面上传。完成子项目信息页面填写后点击页面下方的Continue进入上传文件页面。iProX提供两种上传文件的方式:通过网页直接上传(Upload by Browse),适合少量并且较小的文件(网页上传文件大小不能超过4Gb);通过Aspera插件上传(upload by Aspera),适合大量较大的文件(不受文件大小和数量的限制)。

选择好提交数据的方式(Complete submission/Partial submission)和上传文件方式(Browse/Aspera)后,点击“Add file”选择本地要上传的数据文件,可以同时选择多个文件;系统会根据文件名后缀自动判断文件类型,对判断不正确的文件类型,可以点击文件后面的下拉菜单进行修改,可为每个文件添加其一个多个关联的文件。完成上述操作后请点击“Start upload”进行文件上传,文件上传完成后页面上会出现提示,然后可以点击“Continue”进入提交页面。

640 (3).png

图6.上传数据




步骤五:提交项目和子项目

点击下方“submit”键后项目(包括子项目)将提交给iProX数据管理员进行发布前审核,审核通过后提交者邮箱和站内信将收到相应通知,此时用户上传的数据文件正式完成提交。审核通过后,就可以获得IProX编号。

640 (4).png

图7.项目提交



至此,蛋白质组学的数据上传工作就圆满完成了,是不是没有想象中的难~



数据集的引用

原始数据上传完成后,可以在文章致谢后的"Data Availability"中或者其他位置写明数据集的访问信息(URL, project ID),保密的数据集需在邮件里告知编审数据访问的账号和密码。



标签

0

最近浏览:

相关产品

相关新闻

北京青莲百奥生物科技有限公司

固话:010-53395839
邮箱:service@qinglianbio.com
地址:北京市海淀永捷南路2号院1号楼 中关村科学城·乡创中心


扫一扫,关注我们