您所在的位置:主页->新闻动态->公司新闻

  • 010-51651689
  • sales@tech-box.com.cn

公司新闻

【Tech-Box在线课程】Pipeline Pilot – 数据科学编程平台介绍II:数据的读取、清洗和整合

数据科学是一个跨学科领域,数据科学使您能够将业务问题转换为研究项目,然后将其转换回实用的解决方案。强大的数据科学同时对研究人员提出很高的要求。借助合适的工具,技术,算法,我们可以使用数据并将其转换为独特的业务优势。


BIOVIA Pipeline Pilot是专门为数据科学编程提出的基于友好的图形界面编程平台。它提供标准的数据读取、清洗、整合和特征识别和结果输出功能;同时还提供专业的三维晶体和分子结构操作、聚合物性质预测、机器学习、图像处理等功能。


标准的数据处理流程包括数据获取、分析和结果显示。其中第一步数据整合、清洗和整合是整个数据科学工作流程中最耗时的步骤,超过50%的时间。Pipeline Pilot内置了ETL工具,在前期数据处理方面提供高效、方便的处理手段,同时可以无缝链接任意数量的数据源。Pipeline Pilot提供强大的自动化操作功能,可轻松实现重复性任务和开放式协作操作。



北京泰科博思科技有限公司2020年5月15日上午10:00~11:00举办“Pipeline Pilot – 数据科学编程平台介绍II:数据的读取、清洗和整合”在线讲座,重点介绍Pipeline Pilot在数据科学第一步,数据读取、清洗、整合方面的功能。


【报名方式】请点击下方链接,在线报名

https://3ds.tbh5.com/EventDetail.aspx?eid=277&f=techbox


【BIOVIA Pipeline Pilot介绍】

Pipeline Pilot(PP)是法国达索系统公司BIOVIA品牌下的用于信息整合和流程定制平台。它在优化研究创新周期、提高工作效率与减少研究和IT经费方面能发挥巨大的作用。通过Pipeline Pilot用户不仅能够整合和挖掘杂乱无章的海量数据、自动化数据的分析流程,而且还可以实现企业级的研究成果快速分析、可视化与共享,提升大范围的写作能力。



Pipeline Pilot通过提供科学数据分析功能(绿色部分)和允许自动和标准化处理手工、重复数据准备和验证任务(蓝色部分),从而实现优化研发创新的循环周期。使得科学家和工程师们能够集中精力,将他们的知识和能力投入到创新真正需要的工作上,适用于只要、生物技术、材料科学、个人消费品、石油、天然气、汽车、航空航天、能源和国防等多个领域。


【主要功能】

包含15+种机器学习方法,处理科学和工程数据;

合并、链接、表征和清洗数据集;

进行探索性分析,包括主成分分析(PCA)、聚类分析和多维数据可视化;

快速建模可扩展的贝叶斯分类模型;

使用GFA方法的遗传算法进行变量选择,并构建回归集合模型;

构建准确、易用的随机投影森林回归和分类模型;

使用基于R的机器学习方法,如向量机、神经网络和XGBOOST,并且无需编写R脚本;

机器学习框架内对任何类型的模型进行交叉验证、超参数调整和变量重要性评估;

使用回归和分类模型评估查看器,评估和比较模型测试集的性能;

使用内置适用性域量和错误模型,评估特定样本的预测置信度;

将帕累托优化方法应用于多目标优化问题。


【北京泰科】

北京泰科(Tech-Box)提供专业的材料、化工、药物、数据挖掘、虚拟仿真等领域整体解决方案。用户根据需要在我们的平台上高效地进行各种模拟实验,指导实际的生产和设计。我们致力于用世界最先进的模拟技术及全面的服务,增强您的研发能力、加速您的研发进度、助推您的研发以最经济有效的方式走在世界的最前列。