预紧器图标

信息怪物播客

第12集:医疗保健术语标准化和规范化

2020年11月17日

在本期的Informonster播客中,Charlie Harp讨论了标准化和规范化的概念,它们在医疗保健术语上下文中的含义,以及它们的相对优缺点。

h

查看记录

关注我们

有问题或主题想法吗?

获取我们的新闻和更新

获得有关新播客剧集,即将举行的活动和网络研讨会等的通知!

成绩单

大家好,我是查理·哈普,这里是信息怪物播客。现在,在今天的Informonster播客中,我们将讨论规范化和标准化之间的区别,以及这些术语如何在医疗保健分析中使用,以及这些术语造成的一些混淆。所以让我们从说它不是什么开始因为如果你有数学背景,或者你有机器学习背景,你是一个数据科学家,你在街上遇到你的医疗术语专家,他们正在谈论标准化和规范化,首先要发生的事情是你会有一个很大的认知失调在你们两个之间。因为在机器学习和数学中,归一化和标准化是“特征缩放”的一部分,在这个过程中,你取值,然后把它们放入一个共同的框架中进行分析和比较。这是标准化的一个有效定义,你看的是标准偏差内的一个值,而规范化,你把0到1之间的数据规范化,这样你就可以做某些类型的比较活动。但是当我们谈论信息学世界中的标准化和规范化时,我们的意思是有一点不同的术语。我来谈谈这个。

因此,如果您考虑医疗保健企业的生态系统,通常会有“n”个端点,它们将术语流式传输到中心位置或您。你从n个端点接收数据。它们都在使用不同的代码集,或者至少是不同代码集的集合,在它们的集合中,你想对这些数据做一些有用的事情。为了能够做到这一点,为了能够建立规则,图表,分析和其他东西,你需要基于一些规范的参考术语来做这些。所以你有一组标准的术语,或者一组正常的术语,你已经定义了,你在建立规则,或者你在做分析。当所有这些不同的术语和所有这些不同的代码出现时,你需要将这些入站概念与你所理解的东西结合起来,并将所有规则建立在这些概念之上。女士们先生们,这就是我们所说的术语和医疗保健的正常化。我有一个入站代码。这是医院的本地密码系统。它的源代码是一个整数100,单词是“banana”。 But when I land that data in my data warehouse, if I want to be able to do my banana analytic on that data, my code for banana is “B75.” So that means when that code comes in, I have to assign it to “B75” for it truly to be recognized as a banana, and that’s normalization.

当涉及到医疗保健术语时,规范化通常使用我们称为映射的东西来完成,这是另一个经常被误解的东西,因为我们在谈论消息和语法时也使用术语“映射”。但在这种情况下,我们从那个站点输入代码100,我们说,“当它输入时,赋值为B75,因为它实际上是一根香蕉。”因此,规范化允许我们将来自外部世界的数据进行规范化;从异常到正常。我说“不正常”并不是贬义的。我的意思是,“正常”是你所期望的,是你所习惯的,而这些其他的代码不是那样的。

这就是标准化。如果标准化是从其他地方取一些东西并将其与您期望和正在使用的规范性参考概念对齐,那么标准化是什么?这是一个有趣的问题,因为它取决于你是在谈论正常化,还是在谈论其他东西,我会解释我的意思。在规范化的背景下,标准化是指将某物规范化到一个标准。举个例子,如果我拿着代码,药物代码来自我的整个企业,我把它们与一个代码对齐,你知道,我的药剂师斯塔夫罗斯在地下室培养的代码,这是一个神奇的药物代码系统,但它们是斯塔夫斯代码。我正在将整个企业的药物代码标准化为斯塔沃斯创建的代码。我正在规范化,我的规则知道Stavros的代码,所以一切都按照它应该的方式工作。但根据我们今天要用的定义,它不是标准的。我一会儿会谈到范围,但通常当我们谈到标准化时,如果我要把那些来自整个企业的药物代码,我将它们标准化到RxNorm,这是一个国家标准,那么我不仅标准化了这些代码,而且标准化了代码。看到我做的了吗? The reason why it’s different is because a “standard” implies that it is shareable. It is some kind of universal. I have made it a standard, and therefore I can share it with anybody that has adopted that standard.

因此,这就是我要与一些人的观点有所不同的地方,“硬核标准化意味着这一点”,因为我认为标准化是在旁观者的眼中。所以我想说,如果我标准化到国家标准,那么我就在国家层面上标准化了我的数据。但如果我是一家大型医院企业的一员,我创建了一个“竖琴医院”,或者“竖琴卫生系统标准”,那么我也已经标准化了,但我已经标准化了一个“竖琴医院”的标准,而不是一个国家标准。但是当大多数人谈论标准化时,你在街上碰到一个人,你知道,你提到标准化,你会说,“嘿,我已经标准化了我所有的数据。”那个人可能会认为你将其标准化为国家标准。这意味着你可以和他分享你的数据,只要他理解国家标准,只要他和你来自同一个地方。因为如果他来自布拉迪斯拉发,他们可能有不同的国家标准,那么你就没有标准化,因为你需要一个全球标准来做到这一点。这就是为什么我认为标准是关于范围的因为它取决于你在哪里。如果你要离开这个星球,去到马头星云,你会说,“我把医学术语标准化到地球标准了。”他们会说:“好吧,这很好,但你什么时候能像我们其他人一样,把银河系的标准标准化呢?”

所以还有另一种思考标准化的方式。这是我最近在与大型组织交谈时遇到的情况。有时候当人们谈论标准化和规格化的时候,他们并不是在谈论如何规格化,是标准化还是非标准化。它们的实际含义与此大不相同。那就是你是否要进行规范化,也就是让所有端点上存在的数据,继续保持不正常,或者,你知道,是本地的,当数据到达一个中心位置时,你要对这些数据进行标准化,以便你进行聚合,而当他们说标准化时,他们更多地是在谈论它作为数据治理的功能。他们说的是,与其让我所有的50家医院都有自己的代码,我将它们标准化,这样当我得到这里的数据时,我可以用它们做事情,我要标准化所有这50家医院,这样他们都和我使用相同的代码。现在,作为数据治理功能的标准化是一种稍微不同的动物,因为实际上您正在做的是建立一个标准,无论您采用的是国家标准还是创建企业标准,然后您基本上要求所有端点在其数据字典中采用该标准,从而消除了规范化的需要。所以假设是,不是每个人都说自己的语言,我们都要学习同一种语言,这样我就不需要翻译任何出现在我面前的东西。我会理解的。然后当我做决定或做事情时,这将是伟大的,因为我们都说同一种语言。 Now, one of the things I want to say about that is it seems very attractive because normalization is a headache. Anybody that does semantic normalization, and to do analytics, knows that the lifestyle choice. It’s not a project you do once and you’re done because terminologies are constantly evolving and things get added, and it’s a lot of work. And you have to dedicate resources to it, and people don’t like doing it. So it’s, it’s kind of like mowing the lawn. The lawn keeps growing. You’ve got to get out there. You may not like it. Now, I happen to like mowing my lawn, but not everybody does. But you get out there and somebody has to mow that lawn every week, or it gets out of control. Normalization is the same thing.

所以人们被这个想法,被这个标准化的乌托邦蒙蔽了,这样他们就不用再这样做了。但是你可以想象,如果我们坚持用割草的比喻,你几乎可以把标准化想象成说,“好吧,我不想割我的草坪。所以我要把它铺好。我要用混凝土把它铺好这样我就不用再搬了。这将会非常棒。”我认为,这并不是说我反对标准化,我认为标准化的问题在于,大多数人这么做是因为他们不喜欢标准化,也因为人们在数据科学领域犯下了严重的罪行,人们没有实践良好的数据治理。所以他们创造了一些毫无意义的可怕术语,或者他们创造了重复的术语,或者他们重复使用具有不同含义的代码。当你在聚合和分析中遇到这种情况时,它真的会损害你的数据质量。所以这是一个组合,“我不想做标准化”,在网站上的人不是术语学家,他们是有正常医院工作的人,他们在添加代码。“如果我们标准化,一切都会变得更好。” Now, I’ve seen people do this successfully or, well, they implemented it, but in my experience, it hasn’t been hugely successful. Now the exception that kind of proves the rule is when you think about drug terminologies. So as you might know, I was at FTB for 10 years, and First DataBank, Medi-Span, MULTUM, those compendia are an example of a standard. They’re are third-party standard, but basically when you look at drug terminologies across a lot of organizations, they’re all using First DataBank. They’re all using Medi-Span, ideally. They might be using NDC codes, but they’re using something. They’re sending those in to whoever’s using it, and usually they have RxNorm codes on them and everything else. As a result, medications, you know, they flow pretty well through our electronic ecosystem, but they’re not perfect. Standardization didn’t solve the problem. There is still usually some normalization required in that process. Well, why is that? If standardization is an informatics utopia, then why do we still encounter issues when we try to standardize?

原因与映射永远不会完成的原因相同,如果您规范化的话。医疗保健中的大多数术语,大多数有意义的术语都不是静态的。他们不断变换。东西增加了,东西改变了,东西调整了。在院子里铺路的问题是什么都长不出来。同样的道理也适用于医疗保健企业。如果你从中央授权,这些就是你要使用的术语。问题是,处于边缘的人实际上是在战壕里的人。他们实际上是那些不得不在库存中添加东西的人,或者需要把事情弄清楚的人,或者医生对他们大喊大叫,“你需要添加这个。”问题是,虽然有一些代码系统,一些代码集你可以从数据治理的角度进行标准化,如果它们是相当静态的,它们不是很大,那么,你知道,像性别,种族,遇到类型这样的东西,我们有很多微观术语,你应该能够标准化这些,然后说,嘿,你要用这些

问题是,当你开始尝试标准化较大的项目时,比如程序、收费代码——我说的不仅仅是临床概念。我说的是商业和管理概念。当人们大量互动的东西,是高度动态的,最终会发生的是,如果你要求这些东西以一种标准的方式来自中心,那么边缘的人就会被扼杀。他们很有可能会反抗,我指的不是干草叉和火把。他们会说,“嗯,我找不到代码。所以我不写代码。我要把它写在笔记里。我要把它藏到只有人类才能找到的地方。”另一件会发生的事是他们会生气。他们会生气,因为他们需要添加一些东西,他们需要说一些东西,他们需要做一些事情,现在他们正在与一个过程进行交互,以获得一些添加的东西,这阻止了他们做他们需要做的事情。 Whereas if they could just go to their local person and say, “Add this to the drug dictionary in the system,” they could do that and move fairly quickly. If now they have to go through some chain of command to get something approved, they’re going to struggle. And what’s going to happen is if you say you’re going to standardize, and you mandate it, and you go out into the field and you say, “This is what will happen,” what I’ve seen occur more often than not is they try to do that, and then the system starts to fray. People start to get stifled. People start to find work arounds. Some people just outright rebel and say, “I don’t care, I’m going to add it,” and then you’ve got this Frankenstein monster of a “standard”, a governance standard approach with normalization on the side, because you are trying to accommodate the people in the trenches that are ultimately the ones responsible for making sure the business is successful. I’m not really sure what to call this because, as I encounter this, people say standardization and some people go, “Yes, standardization is good,” because they think you’re normalizing to a standard like SNOMED, or RxNorm, or LOINC. But when you think about this idea of mandating terminology across your organization, I’m not saying you can’t pull it off, you might be able to pull it off, but you have to have an excellent governance process. You have to have systems in place so the turnaround time and the delivery of those enterprise standard concepts to where they’re being consumed is almost zero latency. Which means that a lot of times, when we engage in this kind of terminology business, we elongate the process from a central data governance perspective, and you really have to be agile or the edges will feel stifled, and they’ll start to work around and it’ll all start to unravel.

这只是我的个人经验,当涉及到这种事情时。我不觉得这是个坏主意。我想,就像我之前说的,有很多小术语,比如,如果你能把地点、部门和专业标准化,你能牢牢控制的事情,你就能做到。业务实体类型的元数据实际上是一件非常好的事情,如果您能够实现它,那么您只需找出如何在使用这种数据的所有不同系统中部署它。标准化管理的另一个挑战是,你知道,当你处理多个电子病历时,维护它们,同步它们,并提供它们的过程也有点挑战性。

睁大你的眼睛,确保你有一个非常好的过程,有一个紧凑的周转,把数据带回现场,并有一个应急计划,因为我几乎可以保证,迟早你必须开始例外。这就是医疗保健的本质。我见过很多。如果你做到了并且成功了,那么我想在这个播客上和你谈谈,因为你知道其他想尝试的人需要知道和理解的事情,我也想知道你是如何做到的。如果你尝试过这种方法,但没有成功,我也很想和你谈谈。让我们面对现实吧,我很想和播客上的任何人交谈。无论如何,这就是我关于标准化和正常化的演讲。我真的很感谢你的收听,我们已经开始有更多的人在听我们的节目了。我们在未来会有一些令人兴奋的事情发生,不仅仅是我,我也想说,如果有人对播客有想法,如果你想让我深入研究一些东西,给你临床建筑的看法,我很乐意让它发生。乐动体育平台再一次,这是查理·哈普,这也是informmonster播客。 Thank you. Stay well and stay safe.