公司动态

了解最新公司动态及行业资讯

当前位置:首页>新闻中心>公司动态
全部 1444 公司动态 464 行业动态 487

这样也行?(制造业必看!数据分析全流程落地手册:Top10药企案例 避坑指南!)数据分析,

时间:2025-07-05   访问量:0

新药研发,动辄烧钱几十亿美金,耗时十几年!这么重要的活儿,国内顶尖的Top10药企却发现:管理竟然还在靠人工记?项目多了手忙脚乱,进度延误、信息滞后、浪费严重… 钱花了,效率却上不去,急不急人?

今天,我们就拆解一个真实获奖案例,看看这家Top10药企如何用精准的数据分析,锁定临床试验中的问题,把混乱的数据变成省钱、省时、提效的“宝藏”!思路清晰,方法实用,制造业搞数据分析的朋友,千万别错过!

特此声明,此案例来自可视化大赛获奖作品:【2021BI数据分析大赛】工业制药-数据探究,感谢参赛选手的热情分享!作者的分析思路和数据分析方法很值得大家参考和借鉴。

一、案例背景

参赛作者目前就职于全国医药研发行业 Top10 药企,从事临床试验商业数据分析工作。说白了,就是想靠数据资产驱动企业业务优化,可现在大数据分析在临床试验领域还没系统化地大规模应用起来。

1.新药研发面临的问题

(1)研发环节多:内外龙头制药企业都在新药研发上砸了不少资源,但新药研发这事儿,环节多、研究还得特别严谨,耗时 10-15 年不说,耗资能达到数十亿美元,临床试验更是其中的重要一环。

(2)研发管理混乱:公司这几年创新药临床试验项目增长得挺快,从最开始的几个增加到一百多个,投入也一年比一年多。可传统的人工管理方式问题太多了,进度管控滞后、信息更新不及时、过程管理不规范,浪费大量人力、物力、财力,听着是不是很熟?

2.现有数据应用系统存在一些局限

研发部门也不是没行动,用了 IRT、EDC、CTMS 这些数据应用系统。但说白了,这些系统生成的数据也就只是当个证据,用来写临床试验报告,等新药试验完成后交给国家药监局审查。而且数据都是以项目为范畴,独立存在的。加上这些系统都是 SaaS 架构,数据分散存在不同供应商的平台上,根本没法统一管理。

这些数据背后藏着试验的关键节点、进度、受试者质量、财务花费是否合理等好多信息,覆盖了临床试验运营的方方面面,可数据的价值压根没被充分挖掘出来

3.解决方向

那该怎么办呢?其实很明确,就是要打通临床试验各应用系统的数据壁垒,把临床试验相关数据结构化、流程化、成体系地沉淀下来,搭建数据仓库,制定数据相关标准。简单来说,就是通过这些操作,服务于临床试验运营的各个方面,挖掘数据的商业价值,最终提升运营效率,节省研发成本。

看到这里,送给大家一份干货满满的《制造业数字化全流程资料包》,里面有关于制造业从0-1,从1-100做好数字化转型与全链路数据分析的全部流程,可以作为补充阅读,放心食用:https://s.fanruan.com/uzljo(复制到浏览器打开领取)

二、分析思路

做数据分析的时候,不能只盯着一个角度看,得从多方面下手,才能把药品研发的情况摸透。我一直强调,全面了解才能做出靠谱的分析,听着是不是很熟?具体的分析思路我给你理理:

1.核心指标体系搭建

业务流程上,临床试验里受试者入组是个关键节点。整个试验过程中,受试者要参与的环节不少,包括签署知情同意书、按试验标准筛选、入组(也就是开始吃试验药)、用药期间访视、异常出组、完成研究。这些环节一环扣一环,少了哪个都不行。

我们从里面挑了 3 个重要节点:参与筛选、入组、异常出组(也就是脱落)。对应的核心指标就是:筛败率(入组率)、达成率(差值)、脱落率

简单来说,就拿达成率(差值)举例,说说核心指标体系怎么搭:

(1) 指标拆解:达成率 = 实际入组人数 / 计划入组人数,差值 = 实际入组人数 - 计划入组人数。这两个公式很重要,是后面分析的基础。

(2) 维度细分:有时间维度(年份、月度)、项目维度(产品、项目)、地理纬度(大区、省份、中心)。这里得说明一下,项目维度里产品和项目是一对多的关系,也就是说一个产品(药物)可能会针对不同病症开展多个项目,这点别搞混了。

(3) 数据口径定义:明确每个数据指标到底怎么算,包含哪些范围,不能模棱两可。

(4) 全面检查指标:复核所有指标的口径和维度,还要确定更新周期。这一步是为了保证数据的准确性和时效性,不然前面的工作都白做了。

同理,筛败率、脱落率的指标体系搭建也差不多,这里就不啰嗦了。

2.制作看板各个模块

还是拿达成率来说,整个数据看板可以分成 6 个模块:宏观指标查看、项目级别筛选、一级维度(年度)、二级维度(月度、项目、大区、省份)、三级维度(中心)、明细数据

需要说明的是,这次呈现的数据都是公司的临床试验数据,而且都经过了随机值处理和敏感信息处理,不用担心数据安全问题。

三、分析步骤

按照上面的分析思路,接下来我们将按照以下步骤逐步深入地开展分析工作。通过系统化的分析流程,可以更清晰地识别药物研发的关键问题所在,并进行针对性的改进和优化。

1.获取数据

这次参赛用的是企业数据,相关人员已经做了脱敏处理,最后确定用 DM 层的 4 张数据表,分别是:项目级汇总数据集、中心级汇总数据集、受试者明细数据集、漏斗图专用数据集。用过来人的经验告诉你,数据的准确性和完整性在这个阶段就得把控好。

2.数据处理

(1)DM 层数据集

DM 层数据集是由 ODS 层数据、EDW 层数据制作出来给看板用的。简单说,ODS 层存的是通过接口程序从多个应用系统抽取的基础数据,到了 EDW 层,会对这些数据进行清洗、转化、筛选、连接、汇总等操作,汇总成受试者级数据集、中心级数据集、项目级数据集,还专门整理了漏斗图专用数据集。

数据处理过程都是用 Mysql 数据库,编写存储过程,让它自动运行生成最终数据集,然后存在数据仓库 DM 层。这样做能提高效率,还能减少人为操作的错误。

(2)维度与度量值

根据前面的数据指标体系,确定好明确的数据指标及相关维度。通过多个维度的交叉、联动,能分析出相关指标的变化趋势,还能根据历史数据预测未来一段时间的数据,这样业务人员就能制定合理的应对策略,让整个项目能持续、良性地推进,听着是不是很有道理?

3.制作可视化报告

下面就以计划与入组为例来梳理一下看板整体布局:

(1) 模块 1:宏观指标展示

宏观指标默认显示的是总量,比如总的样本量(预期入组人数)、总的产品数、总的项目数等等。而且它会跟着看板其他模块的点击产生数据联动,展示出相应的宏观数据,是不是很方便?

(2) 模块 2:项目级别筛选

这个饼状图(公司项目级别)能把数据分成三类:集团重点、子公司重点、待定。通过它可以快速筛选出不同级别的项目数据。

(3) 模块 3:一级分析维度(年份)

在计划与达成看板里,年份是倒序展示的,这样能突出最近一年的计划与入组情况。我一直强调,领导更看重差值,所以这里就用了差值这个指标代替达成率,而且在入组柱状图里用颜色变化体现出来,数据提示里还用橙色突出显示,一眼就能看明白。

(4) 模块 4:二级分析维度(月份、项目、大区、省份)

这里用了 Tab 组件,把二级维度(月份、项目、大区、省份)整合到一起。通过数据联动,能从多个维度进行分析,而且差值这个指标也通过颜色体现在入组柱状图中,是不是很直观?

(5) 模块 5:三级分析维度(中心)

中心分布作为三级分析维度,放在最后,因为中心层级基本快到明细数据了。它还是通过计划入组、实际入组这两个指标来展示,差值也体现在入组的颜色上。由于中心名称比较长,所以横轴标签用了中心 ID,中心名称在提示里显示,这样布局更合理。

(6) 模块 6:数据明细

明细数据展示了模块 2-5 涉及的所有维度,而且对差值指标做了数据预警。差值大于等于 0,就是达成了,用绿色向上箭头表示;差值小于 0,就是没达成,用红色向下箭头表示。通过明细数据,能明确各个中心的具体进度,责任到人,这样就能有针对性地调整工作,避免资源浪费,提高项目运营效率。

4.可视化分析

计划与入组看板最核心的功能就是联动分析,这一点一定要用好。宏观数据有:30 种产品、57 个项目、5713 样本量、3899 计划入组数、3683 已入组人数、涉及医院 232 家。这些宏观指标会随着年度(一级维度)、月度 / 大区 / 省份 / 项目(二级维度)、中心(三级维度)这 6 个维度,以及项目级别(饼状图)的变动产生数据联动,方便从整体到局部了解情况。通过它们可以对比分析两类项目在各年份的分布:

四、总结

这家Top10药企的经历告诉我们:在制造业,尤其是高投入的领域,数据绝不能躺在系统里睡大觉。通过搭建清晰的指标体系、打通分散的数据、设计层层深入的可视化看板,可以成功做到:

一眼看清全局: 宏观指标随时掌握。

精准定位问题: 哪个项目慢了?哪个中心掉链子?数据直接“说话”。

责任到人,快速行动: 明细数据带预警,谁负责、该补哪,清清楚楚。

结果呢?临床试验管理效率大大提升,宝贵的研发资源和时间被有效节省!这套从实战中打磨出来的数据分析方法,思路清晰、步骤明确,非常值得各位制造业同行借鉴。

上一篇:燃爆了(惊天丑闻!数百AI“脱衣”广告攻陷Meta!官方暴怒,悍然起诉!胡歌深爱她,刘烨难忘她,央视力捧她,为什么始终不红?)社交媒体推广,

下一篇:新鲜出炉(中电金信申请数据分析方法等相关专利,保证数据分析结果的时效性)数据分析,

在线咨询

点击这里给我发消息 售前咨询专员

点击这里给我发消息 售后服务专员

在线咨询

免费通话

24小时免费咨询

请输入您的联系电话,座机请加区号

免费通话

微信扫一扫

微信联系
返回顶部