Please use this identifier to cite or link to this item:
http://ithesis-ir.su.ac.th/dspace/handle/123456789/5213
Title: | Estimation of HbA1c in type 2 diabetes patients using machine learning : a case study of Rayong Hospital in Honor of Her Royal Highness Princess Maha Chakri Sirindhorn การประมาณค่า HbA1c ในผู้ป่วยเบาหวานชนิดที่ 2 ด้วยเทคนิคการเรียนรู้ด้วยเครื่อง: กรณีศึกษาโรงพยาบาลเฉลิมพระเกียรติสมเด็จพระเทพรัตนราชสุดาฯ สยามบรมราชกุมารี ระยอง |
Authors: | Phongpen KAMPEW ผ่องเพ็ญ คำผิว Suang Rungpragayphan สรวง รุ่งประกายพรรณ Silpakorn University Suang Rungpragayphan สรวง รุ่งประกายพรรณ RUNGPRAGAYPHAN_S@su.ac.th RUNGPRAGAYPHAN_S@su.ac.th |
Keywords: | HbA1c machine learning predictive model HbA1c machine learning predictive model |
Issue Date: | 28 |
Publisher: | Silpakorn University |
Abstract: | HbA1c is an important variable for follow up medication and adherance of type 2 diabetes mellitus patient,But sometimes patient can lose their HbA1c check up that appoint 1-2 times a year.This study focus on estimate HbA1c by using machine learning technic.Recurit 5,067 sample and 23 variables from Electronic Health Record of Rayong Hospital in Honor of Her Royal Highness Princess Maha Chakri Sirindhorn.The relationships were analyzed using Pearson's correlation for interval and higher-level variables, and Spearman's correlation for ordinal variables. The results of the Pearson's analysis showed that the variable with the strongest correlation to HbA1c was FBS, followed by Creatinine and eGFR. The Spearman's analysis indicated that the variables with the highest correlations were insulin treatment, the number of blood glucose-lowering medication types received, and gender, respectively. Variables that did not exhibit a significant correlation with HbA1c at the 0.05 level were SBP, BUN, education level, and Metformin treatment.Create predictive model using 6 algorithms, Multiple Linear Regression (MLR), Support Vector Machine (SVM), Random Forest (RF), Multivariate Adaptive Regression Splines (MARS), Deep Neural Network (DNN)and Extreme Gradient Boost (XG boost) with many type of sample group .The highest performance was found to be Random Forest (R squared = 0.3726) and Extreme Gradient Boost(R squared = 0.3560) , while the models with the lowest performance were MARS in all-type patient sample group and DNN in non-ckd patient sample group. Specification sample group can decrease prediction error, The lowest error found in non-ckd and HbA1c 6.5 - 9.9 % sample group with MAPE 8% ค่า HbA1c เป็นตัวแปรสำคัญในการติดตามผลของการใช้ยาและความร่วมมือในการรักษาของผู้ป่วยเบาหวานชนิดที่ 2 ซึ่งโดยปกติผู้ป่วยจะได้รับการตรวจปีละ 1 - 2 ครั้ง แต่ในผู้ป่วยบางกลุ่มบางรายอาจไม่สามารถมารับการตรวจตามนัดหมายได้ ทำให้ข้อมูลของค่า HbA1c ขาดหายไป ดังนั้นการศึกษานี้จึงมุ่นเน้นการประมาณค่า HbA1c ผ่านแบบจำลองที่ได้จากเทคนิกการเรียนรู้ด้วยเครื่อง โดยรวบรวมข้อมูลย้อนหลังจากเวชระเบียนอิเล็กทรอนิกส์ของโรงพยาบาลเฉลิมพระเกียรติสมเด็จพระเทพรัตนราชสุดาฯ สยามบรมราชกุมารี ระยอง ซึ่งมีผู้ป่วยทั้งหมด 5067 รายและตัวแปรที่นำมาศึกษา 23 ตัวแปร เมื่อวิเคราะห์ความสัมพันธ์ด้วยวิธี Pearson สำหรับตัวแปรชนิด Interval ขึ้นไป และ Spearman สำหรับตัวแปรชนิด Ordinal ผลการศึกษาด้วยวิธีของ Pearson พบว่าตัวแปรที่มีความสัมพันธ์กับค่า HbA1c มากที่สุดคือ ค่า FBS รองลงมาคือค่า Creatinine และ eGFR ส่วนผลการวิเคราะห์ด้วยวิธีของ Spearman พบว่าตัวแปรการได้รับยา insulin, จำนวนชนิดของยาลดระดับน้ำตาลในเลือดที่ได้รับ และเพศ เป็นตัวแปรที่มีความสัมพันธ์มากที่สุดตามลำดับ ตัวแปรที่ไม่มีความสัมพันธ์กับค่า HbA1c ที่ระดับนัยสำคัญ 0.05 คือ ค่า SBP, ค่า BUN, ระดับการศึกษา และการได้รับยา Metformin เมื่อสร้างแบบจำลองสำหรับการประมาณค่า ด้วยอัลกอริทึม 6 ชนิดคือ Multiple linear regression (MLR), Support vector machine (SVM), Random Forest (RF), Multivariate Adaptive Regression Splines (MARS), Deep neural network (DNN), Extreme gradient boost (XG boost) และเปรียบเทียบกลุ่มตัวอย่างหลายๆ แบบพบว่าแบบจำลองชนิด Random Forest (R squared = 0.3726) และ Extreme Gradient boost (R squared = 0.3560) มีประสิทธิภาพสูงที่สุด ส่วนแบบจำลองที่มีประสิทธิภาพน้อยที่สุดคือแบบจำลอง MARS ในกลุ่มตัวอย่างทั้งหมดและแบบจำลอง DNN ในกลุ่มตัวอย่างที่ไม่มีผู้ป่วย CKD และการกำหนดกลุ่มตัวอย่างจะช่วยลดความแปรปรวนของการประมาณค่า HbA1c ได้ โดยเมื่อทดสอบในกลุ่มผู้ป่วยที่ไม่มีโรคร่วม CKD และมีค่า HbA1c อยู่ในช่วง 6.5 - 9.9 % จะได้แบบจำลองที่มีค่าความแปรปรวนน้อยที่สุดคือค่า MAPE 8 % |
URI: | http://ithesis-ir.su.ac.th/dspace/handle/123456789/5213 |
Appears in Collections: | Pharmacy |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
620820022.pdf | 2.76 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.