Tutorial sobre la estimación de costos asociados con estados del modelo de enfermedad usando GLM - Healthcare Economist

Modelar los costos de la atención médica suele ser problemático porque se distribuyen de manera anormal. En general, Hay un gran número de observaciones de $0 (es decir, personas que no utilizan ningún servicio de atención médica) y una distribución de costos muy sesgada entre los usuarios de atención médica. Esto se debe a que un número desproporcionado de personas tiene costos de atención médica muy altos. Esta observación es bien conocida entre los economistas de la salud. Pero un factor que complica a los modeladores es mapear los costos de las enfermedades en estados de atención de salud específicos. Por ejemplo, mientras que el costo de la atención del cáncer puede variar según la etapa de la enfermedad y la propagación del cáncer o no. El coste de la enfermedad coronaria es diferente si el paciente sufre un infarto de miocardio, el artículo de Zhou et al. (2023) proporciona un buen tutorial sobre cómo estimar costes con estados patológicos modelados utilizando modelos lineales. El tutorial consta de los pasos principales: Paso 1: Preparar el conjunto de datos: los conjuntos de datos generalmente requieren cálculos de costos para períodos de tiempo separados. Por ejemplo, si tiene datos de reclamaciones, Podrás tener información de costos por fecha. Pero para fines analíticos Es posible que desee tener un conjunto de datos con datos de costos por persona (fila) donde las columnas sean costos por año (o mes), o puede crear la unidad de observación para que sea persona-año. Cada fila es un registro de persona-año (o persona-mes) independiente, y cada fila es un registro de persona-año independiente. El siguiente paso es identificar la condición de la enfermedad. en cada periodo Luego se asigna a la persona el estado de enfermedad. Los desafíos incluyen determinar cómo crear estados detallados (por ejemplo, MI versus tiempo desde MI) y cómo manejar situaciones de múltiples estados. Cuando los datos están censurados, podemos (i) agregar una covariable para indicar si los datos están censurados o (ii) excluir observaciones. con algo de informacion Si no hay información de costos (pero los pacientes no son censurados) Se pueden utilizar varios métodos de imputación. Establecer el período de tiempo del análisis requiere mapearlo con la duración del ciclo del modelo de decisión. Gestión adecuada de la censura y puede cambiar la información A continuación se muestra un conjunto de datos de ejemplo. Paso 2: Selección del modelo: este artículo recomienda utilizar un modelo de dos partes con un marco de modelo lineal general (GLM) debido a los supuestos de MCO sobre normalidad y endogeneidad. Lo mismo en los residuos a menudo se viola. GLM, se transforma el valor esperado de los costos. no lineal Como se muestra en la siguiente fórmula. Necesitará estimar tanto la función de enlace como la distribución del error. «El más popular La (combinación de funciones de enlace y distribución) de los costos de atención médica es una regresión lineal. (vínculo de identidad con distribución gaussiana) y regresión gamma con vínculo logarítmico natural) para combinar GLM con un modelo de dos partes. Sólo una estimación La ecuación anterior se aplica a todos los valores positivos y luego se calcula el modelo logit o probit para la probabilidad de que un individuo tenga un costo positivo.Paso 3: Selección del modelo final La selección del modelo requiere primero considerar qué covariables se incluyen en la regresión. Esto se puede obtener mediante una selección gradual utilizando una significación estadística predefinida, aunque esto puede dar lugar a un sobreajuste. Las técnicas de selección de covariables alternativas incluyen bootstrapping, selección por pasos y técnicas de penalización (por ejemplo, operadores de selección y contracción de ángulo mínimo, LASSO). También se pueden considerar interacciones entre covariables. La bondad general del ajuste se puede evaluar mediante el error medio. error medio absoluto y raíz del error cuadrático medio (El último valor es el más utilizado.) Cuanto más apropiado sea el modelo, menos error tendrá. Paso 4: Predicción del modelo Aunque los costos proyectados son fáciles de lograr, Pero el impacto de las enfermedades en los costos es más complejo. Los autores recomiendan lo siguiente: para modelos no lineales de una sección o modelos de dos secciones. Los efectos marginales se pueden derivar utilizando la predicción reciclada. Consta de los dos pasos siguientes: (1) Realizar dos escenarios en la población objetivo estableciendo el estado de la enfermedad de interés en (a) presente (es decir, cáncer recurrente) o (b) ausente (es decir, ninguno). ); (2) Calcule la diferencia de costo promedio entre las dos situaciones. El error estándar de la diferencia de medias se puede estimar mediante bootstrapping. Los autores también proporcionan un ejemplo que ilustra el uso de este enfoque en la modelización de los costos hospitalarios asociados con eventos cardiovasculares en el Reino Unido. El autor también proporciona un código de muestra en formato R y puedes descargarlo aquí.

Source link