【医学影像AI】50个眼科影像数据集(1)分类任务
【医学影像】50个眼科影像数据集(1)分类任务
【医学影像】50个眼科影像数据集(2)分割任务
【医学影像】50个眼科影像数据集(3)其它任务
【医学影像AI】50 个眼科影像数据集(1)分类任务
- 1. 分类任务:青光眼
- 1.1 ACRIMA 青光眼分类数据集(2019)
- 1.2 LAG 青光眼分类数据集(2019)
- 1.3 BEH 青光眼分类数据集(2021)
- 1.4 AIROGS 青光眼分类数据集(2023)
- 1.5 Harvard-GDP 青光眼分类数据集(2023)
- 1.6 JustRAIGS 青光眼分类数据集(2024)
- 2. 分类任务:糖尿病
- 2.1 Messidor-2 糖尿病分类数据集(2014)
- 2.2 Eyepacs 糖尿病分类数据集(2016)
- 2.3 DeepDRiD 糖尿病分类数据集(2022)
- 2.4 BiDR 糖尿病分类数据集(2023)
- 3. 分类任务:眼底疾病
- 3.1 OCT2017 眼部疾病分类数据集(2017)
- 3.2 ODIR-5K 眼部疾病分类数据集(2019)
- 3.2 JSIEC Retinal39 眼部疾病分类数据集(2021)
- 3.4 MuReD 眼部疾病分类数据集(2022)
- 3.5 Retinal OCT-C8 眼底疾病分类数据集(2022)
- 3.6 RFMiD2.0 眼底疾病分类数据集(2023)
- 3.7 MedMNISTv2 眼底疾病分类数据集(2023)
- 3.8 ToxoFundus 眼部疾病分类数据集(2021)
- 3.9 FARFUM RoP 眼底疾病分类数据集(2024)
医学影像已经成为诊断疾病、制定治疗方案和监测病情的重要工具。医疗数据的获取,通常面对隐私、伦理等方面的限制。影像数据的稀缺性,尤其是在罕见疾病、特定人群或新兴成像技术中的数据不足,是人工智能(AI)技术研究和发展的主要挑战。此外,由于对专业知识和对经验的要求,医疗数据的标注通常要由专职医生完成。
作者整理了 50 个眼科影像开源 AI 数据集,介绍这些眼科影像数据集的基本信息和下载地址。本文介绍用于分类任务的数据集。
1. 分类任务:青光眼
1.1 ACRIMA 青光眼分类数据集(2019)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:青光眼
数据来源:西班牙 FISABIO Oftalmología Médica
数据用途:用于青光眼诊断和研究
任务类型:分类任务
样本数量:705
分类类别:2(青光眼,正常图像)
作者:S. Ovreiu, E. -A. Paraschiv and E. Ovreiu
论文引用:S. Ovreiu, E. -A. Paraschiv and E. Ovreiu, “Deep Learning & Digital Fundus Images: Glaucoma Detection using DenseNet,” 2021 13th International Conference on Electronics, Computers and Artificial Intelligence (ECAI), Pitesti, Romania, 2021, pp. 1-4, doi: 10.1109/ECAI52376.2021.9515188.
论文下载:https://ieeexplore.ieee.org/document/9515188
数据集下载:Figshare-ACRIMA
1.2 LAG 青光眼分类数据集(2019)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:青光眼
数据来源:北京同仁医院(Beijing Tongren Hospital)
数据用途:用于青光眼的早期筛查和预防系统
任务类型:分类任务
样本数量:11760
分类类别:2(青光眼,正常图像)
作者:Li, Liu and Xu, Mai and Wang, Xiaofei and Jiang, Lai and Liu, Hanruo
论文引用:Li, Liu and Xu, Mai and Wang, Xiaofei and Jiang, Lai and Liu, Hanruo, Attention Based Glaucoma Detection: A Large-Scale Database and CNN Model, The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2019
论文下载:https://arxiv.org/abs/1903.10831
数据集下载:Github-smilell
特别说明:对 5824张图像被标注了关注区域(attention map),表示眼底图像中的高风险区域。
1.3 BEH 青光眼分类数据集(2021)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:青光眼
数据来源:孟加拉国眼科医院(Bangladesh Eye Hospital)
数据用途:用于青光眼的分类任务
任务类型:分类
样本数量:634
分类类别:2
作者:M. T. Islam, S. T. Mashfu, A. Faisal, S. C. Siam, I. T. Naheen and R. Khan
论文引用:M. T. Islam, S. T. Mashfu, A. Faisal, S. C. Siam, I. T. Naheen and R. Khan, “Deep Learning-Based Glaucoma Detection With Cropped Optic Cup and Disc and Blood Vessel Segmentation,” in IEEE Access, vol. 10, pp. 2828-2841, 2022, doi: 10.1109/ACCESS.2021.3139160.
论文下载:ieeexplore
数据集下载:Github-mirtanvirislam
1.4 AIROGS 青光眼分类数据集(2023)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:青光眼
数据来源:来自500个不同地点、具有不同种族背景
数据用途:用于青光眼的分类任务
任务类型:分类
样本数量:113893
分类类别:2(青光眼,非青光眼)
作者:Coen de Vente; Koenraad A. Vermeer; Nicolas Jaccard; He Wang; Hongyi Sun; Firas Khader
论文引用:C. de Vente et al., “AIROGS: Artificial Intelligence for Robust Glaucoma Screening Challenge,” in IEEE Transactions on Medical Imaging, vol. 43, no. 1, pp. 542-557, Jan. 2024, doi: 10.1109/TMI.2023.3313786.
论文下载:https://ieeexplore.ieee.org/abstract/document/10253652
官网地址:https://airogs.grand-challenge.org/data-and-challenge/
数据集下载:zenodo-AIROGS
1.5 Harvard-GDP 青光眼分类数据集(2023)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:青光眼
数据来源:哈佛医学院(Harvard Medical School)
数据用途:用于青光眼分级诊断和研究
任务类型:分类
样本数量:1544
分类类别:3(正常,早期,中晚期)
作者: Yan Luo, MinShi, YuTian, Tobias Elze, Mengyu Wang
论文引用:Luo, Yan and Shi, Min and Tian, Yu and Elze, Tobias and Wang, Mengyu, Harvard Glaucoma Detection and Progression: A Multimodal Multitask Dataset and Generalization-Reinforced Semi-Supervised Learning, Proceedings of the IEEE/CVF International Conference on Computer Vision, 2023
论文下载:arxiv, openaccess
数据集下载:Github-Harvard-Ophthalmology-AI-Lab, harvard
1.6 JustRAIGS 青光眼分类数据集(2024)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:青光眼
数据来源:EyePACS LLC, US
数据用途:用于青光眼分级诊断和研究
任务类型:分类(二元分类+多标签分类)
样本数量:111183(101442+9741)
分类类别:2(RG, NRG)+ 10
作者: Hans G. Lemij, Coen de Vente, Clara I. Sánchez
论文引用:Lemij H G, Vente C, Sánchez C I, Characteristics of a Large, Labeled Data Set for the Training of Artificial Intelligence for Glaucoma Screening with Fundus Photographs, Ophthalmology Science, 2023, 3, https://doi.org/10.1016/j.xops.2023.100300
论文下载:sciencedirect
数据集下载:zenodo
特别说明:
二元分类标签为:无可转诊青光眼 (NRG),参考性青光眼 (RG)。
10个附加特征的标签为:神经视网膜边缘外观 (ANRS),外观神经视网膜边缘下部 (ANRI),视网膜神经纤维层上层缺损(RNFLDS),视网膜神经纤维层下方缺损(RNFLDI),向上方裸露环状血管 (BCLVS),下方裸露环状血管 (BCLVI),血管干鼻化 (NVT),视盘出血(DH),层状点 (LD),大视杯(LC)。
2. 分类任务:糖尿病
2.1 Messidor-2 糖尿病分类数据集(2014)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:糖尿病(DR)
数据来源:Messidor 数据集+布雷斯特大学医院
数据用途:用于检测和诊断糖尿病视网膜病变
任务类型:分类
样本数量:1748
分类类别:2
作者:
论文引用:Decencière, E., Zhang, X., Cazuguel, G., et al. (2014). Feedback on a publicly distributed database: the Messidor database. Image Analysis & Stereology, 33(3), 231-234, https://doi.org/10.5566/ias.1155
Abràmoff M. D., Folk J. C., Han D. P., et al. (2013). Automated analysis of retinal images for detection of referable diabetic retinopathy. JAMA Ophthalmol, 131(3), 351–357.
论文下载:ias-iss, jamaophthalmol
数据集下载:Messidor-2 Dataset
特别说明:官方下载的数据集只包括突破,不带有标注。第三方提供了标注。
2.2 Eyepacs 糖尿病分类数据集(2016)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:糖尿病(DR)
数据来源:美国EyePACS和印度的3家眼科医院(Aravind,Sankara Nethralaya和Narayana Nethralaya)
数据用途:用于糖尿病视网膜病变的分级
任务类型:分类
样本数量:35126
分类类别:5(No DR,Mild,Moderate,Severe,Proliferative DR)
作者:Gulshan V, Peng L, Coram M
论文引用:Gulshan V, Peng L, Coram M, et al. Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs. JAMA. 2016;316(22):2402–2410. doi:10.1001/jama.2016.17216
论文下载:jamanetwork
官方网站:eyepacs
数据集下载:kaggle-eyepacs, tianchi.aliyun
2.3 DeepDRiD 糖尿病分类数据集(2022)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:糖尿病(DR)
数据来源:上海市第六人民医院
数据用途:用于糖尿病视网膜病变的分级
任务类型:分类
样本数量:2000
分类类别:5(no apparent retinopathy, mild NPDR, moderate NPDR, severe NPDR, PDR)
作者:Ruhan Liu, Xiangning Wang, Qiang Wu
论文引用:Liu R, Wang X, Wu Q, et al., DeepDRiD: Diabetic Retinopathy—Grading and Image Quality Estimation Challenge, Patterns, 2022, 3(6):100512
论文下载:cell
数据集下载:Github-deepdrdoc
2.4 BiDR 糖尿病分类数据集(2023)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:糖尿病(DR)
数据用途:用于糖尿病视网膜病变的分类任务
任务类型:分类
样本数量:2838
分类类别:2
作者:Parisa Karimi Darabi
论文引用:Darabi, Parisa, Diagnosis of Diabetic Retinopathy, DOI:10.13140/RG.2.2.13037.19688
论文下载:researchgate
数据集下载:kaggle-BiDR
BiDR 糖尿病 用于糖尿病视网膜病变的早期检测和分级 2D-Fundus 眼部-眼底 分类 2838 2 Parisa Karimi Darabi K.N.Toosi University of Technology Diagnosis of Diabetic Retinopathy
3. 分类任务:眼底疾病
3.1 OCT2017 眼部疾病分类数据集(2017)
影像类别:2D-OCT,X-ray
检测部位:眼部-眼底,胸部
疾病类型:脉络膜新生血管(CNV),糖尿病性黄斑水肿(DME),
数据用途:用于与视网膜病变相关的模型的训练和测试
任务类型:分类
样本数量:108312
分类类别:4(CNV, DME, DRUSEN, NORMAL)
作者:Daniel S. Kermany, Michael Goldbaum, Wenjia Cai
论文引用:Kermany D, Goldbaum M, Cai Wet al. (2018), Identifying Medical Diagnoses and Treatable Diseases by Image-Based Deep Learning, Cell, 2018, 172(5), 1122-1131
论文下载:cell
数据集下载:Github-aishangcengloua, MendeleyData
3.2 ODIR-5K 眼部疾病分类数据集(2019)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:多种眼部疾病(糖尿病 、青光眼、白内障、年龄相关性黄斑变性、高血压、病理性近视以及其他疾病)
数据来源:上工医疗科技有限公司(从中国不同医院/医疗中心收集)
数据用途:用于眼科疾病的智能识别与分析
任务类型:分类
样本数量:5000
分类类别:8(AMD, Cataract, Diabetes, Glaucoma, Hypertension, PM, Normal, Other diseases)
作者:北京大学健康医疗大数据国家研究院
数据集下载:kaggle-ODIR5K, heywhale ODIR-5K, tianchi ODIR-5K
3.2 JSIEC Retinal39 眼部疾病分类数据集(2021)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:39 种眼部疾病
数据来源:汕头国际眼科联合中心(JSIEC)
数据用途:用于深度学习算法的开发和验证
任务类型:分类
样本数量:1000
分类类别:39
作者:Ling-Ping Cen, Jie Ji, Jian-Wei Lin
论文引用:Cen, LP., Ji, J., Lin, JW. et al. Automatic detection of 39 fundus diseases and conditions in retinal photographs using deep neural networks. Nat Commun 12, 4828 (2021). https://doi.org/10.1038/s41467-021-25138-w
论文下载:nature-Cen2021
数据集下载:kaggle, Github-linchundan88
特别说明:
- 本项目深度学习项目的训练和测试涉及 249620张眼底图像的 275543个标签,但公开数据集为 1000张图像。
- JSIEC 数据集用于检测多种常见的可参考眼底疾病和病症(39类):(0) Normal-正常; (1) Tessellated-马赛克样; (2) Large optic cup-大视盘凹陷; (3) DR1-糖尿病视网膜病变1期; (4) Possible glaucoma-可能性青光眼; (5) Optic atrophy-视神经萎缩; (6) DR2-糖尿病视网膜病变2期; (7) DR3-糖尿病视网膜病变3期; (8) Severe hypertensive-严重高血压性视网膜病变; (9) Disc swelling and elevation-视盘肿胀和隆起; (10) Dragged Disc-视盘拖曳; (11) Congenital disc abnormality-先天性视盘异常; (12) Retinitis pigmentosa-色素性视网膜炎; (13) Bietti crystalline dystrophy-Bietti晶状体营养不良; (14) Peripheral retinal degeneration and break-周边视网膜变性和裂孔; (15) Myelinated nerve fiber-有髓神经纤维; (16) Vitreous particles-玻璃体颗粒; (17) Fundus neoplasm-眼底肿瘤; (18) BRVO-视网膜分支静脉阻塞; (19) Massive hard exudates-大量硬性渗出; (20) CRVO-视网膜中央静脉阻塞; (21) Yellow-white spots-flecks-黄白点; (22) Cotton-wool spots-棉絮斑; (23) Vessel tortuosity-血管迂曲; (24) Chorioretinal atrophy-coloboma-脉络膜视网膜萎缩-缺损; (25) Preretinal hemorrhage-视网膜前出血; (26) Fibrosis-纤维化; (27) Laser Spots-激光斑点; (28) Silicon oil in eye-眼内硅油; (29) Blur fundus without PDR-无增殖性糖尿病视网膜病变的模糊眼底; (30) Blur fundus with suspected PDR-怀疑有增殖性糖尿病视网膜病变的模糊眼底; (31) RAO-视网膜动脉阻塞; (32) Rhegmatogenous RD-裂孔性视网膜脱离; (33) CSCR-中心性浆液性脉络膜视网膜病变; (34) VKH disease-Vogt-小柳-原田综合征; (35) Maculopathy-黄斑病变; (36) ERM-黄斑前膜; (37) MH-黄斑裂孔; (38) Pathological myopia-病理性近视
3.4 MuReD 眼部疾病分类数据集(2022)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:20种眼部疾病
数据来源:由 ARIA、STARE 和 RFMiD 数据集组成
数据用途:用于开发视网膜疾病识别模型的多标签视网膜眼底图像数据集
任务类型:分类
样本数量:2208
分类类别:20
作者:M. A. Rodríguez, H. AlMarzouqi and P. Liatsis
论文引用:M. A. Rodríguez, H. AlMarzouqi and P. Liatsis, “Multi-Label Retinal Disease Classification Using Transformers,” in IEEE Journal of Biomedical and Health Informatics, vol. 27, no. 6, pp. 2739-2750, June 2023, doi: 10.1109/JBHI.2022.3214086.
论文下载:arxiv, ieeexplore
数据集下载:mendeley-MuReD
特别说明:标签类别包括:糖网病(Diabetic Retinopathy,DR)图像,正常(NORMAL)图像,屈光介质混浊(Media Haze,MH)图像,视神经盘凹陷(Optic Disc Cupping,ODC)图像,豹纹状病变(Tessellation,TSLN)图像,老年黄斑变性(Age-Related Macular Degeneration,ARMD)图像,脉络膜小疣(Drusen,DN)图像,近视(Myopia,MYA)图像,视网膜分支静脉阻塞(Branch Retinal Vein Occlusion,BRVO)图像,视盘苍白(Optic Disc Pallor,ODP)图像,视网膜中央静脉闭塞(Central Retinal Vein Oclussion,CRVO)图像,脉络膜新生血管病(Choroidal Neovascularization,CNV)图像,视网膜炎(Retinitis,RS)图像,视盘水肿(Optic Disc Edema,ODE)图像,激光疤痕(Laser Scars,LS)图像,中心浆液性视网膜病变(Central Serous Retinopathy,CSR)图像,高血压视网膜病变(Hypertensive Retinopathy,HTR)图像,动脉硬化性视网膜病变(Arteriosclerotic Retinopathy,ASR)图像,脉络膜视网膜炎(Chorioretinitis,CSR)图像,其他疾病(Other Diseases,OTHER)。
3.5 Retinal OCT-C8 眼底疾病分类数据集(2022)
影像类别:2D-OCT
检测部位:眼部-眼底
疾病类型:多种眼部疾病(AMD, CNV, CSR, DME, MH, Drusen, DR)
数据来源:来自 OCT2017 数据集
数据用途:用于视网膜疾病的识别和分类
任务类型:分类
样本数量:24000
分类类别:8(AMD, CNV, CSR, DME, MH, Drusen, DR, Normal)
作者:M. Subramanian, K. Shanmugavadivel, O. S. Naren, K.
论文引用:M. Subramanian, K. Shanmugavadivel, O. S. Naren, K. Premkumar and K. Rankish, “Classification of Retinal OCT Images Using Deep Learning,” 2022 International Conference on Computer Communication and Informatics (ICCCI), Coimbatore, India, 2022, pp. 1-7, doi: 10.1109/ICCCI54379.2022.9740985.
论文下载:lhncbc, ieeexplore
数据集下载:kaggle OCT-C8
3.6 RFMiD2.0 眼底疾病分类数据集(2023)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:45种眼部疾病
数据来源:Shri Guru Gobind Singhji Institute of Engineering and Technology, India
数据用途:用于眼底图像的多标签分类的数据集
任务类型:分类
样本数量:3200
分类类别:45
作者:Panchal, S., Naik, A., Kokare, M.
论文引用:Panchal, S., Naik, A., Kokare, M., Pachade, S., Naigaonkar, R., Phadnis, P., & Bhange, A. (2023). Retinal Fundus Multi-Disease Image Dataset (RFMiD) 2.0: A Dataset of Frequently and Rarely Identified Diseases. Data, 8(2), 29. https://doi.org/10.3390/data8020029
论文下载:mdpi-RFMiD2.0
数据集下载:zenodo-RFMiD2.0, kaggle-RFMiD
3.7 MedMNISTv2 眼底疾病分类数据集(2023)
MedMNISTv2 包含 12个 2D数据集和 6个 3D数据集,其中 OCTMNIST子集基于109309 张 OCT 图像,RetinaMNIST 子集基于 1600 张 2D-Fundus 图像。
影像类别:2D-OCT
疾病类型:眼部疾病
数据来源:12个2D数据集和6个3D数据集
数据用途:用于支持生物医学图像分析、计算机视觉和机器学习中的研究/教育
任务类型:分类
样本数量:OCTMNIST 109,309 张,RetinaMNIST 1600 张
分类类别:OCTMNIST 4类,RetinaMNIST 5类
作者:Jiancheng Yang, Rui Shi, Donglai Wei
论文引用:Yang, J., Shi, R., Wei, D. et al. MedMNIST v2 - A large-scale lightweight benchmark for 2D and 3D biomedical image classification. Sci Data 10, 41 (2023). https://doi.org/10.1038/s41597-022-01721-8
论文下载:nature, Github-MedMNIST
数据集下载:zenodo-MedMNIST+, medmnist
3.8 ToxoFundus 眼部疾病分类数据集(2021)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:弓形虫性脉络膜视网膜炎
数据来源:Hospital de Clínicas Medical Center
数据用途:用于研究和诊断弓形虫性脉络膜视网膜炎
任务类型:分类
样本数量:412
分类类别:4(healthy, inactive, active, active/inactive)
作者:Cardozo, O., Ojeda, V., Parra, R.
论文引用:Cardozo, O., Ojeda, V., Parra, R., Mello-Román, J. C., Noguera, J. L. V., García-Torres, M. et al. (2023). Dataset of fundus images for the diagnosis of ocular toxoplasmosis. Data in Brief, 48, 109056. https://doi.org/10.1016/j.dib.2023.109056
论文下载:
数据集下载:kaggle-ToxoFundus , zenodo-ToxoFundus
3.9 FARFUM RoP 眼底疾病分类数据集(2024)
影像类别:2D-Fundus
检测部位:眼部-眼底
疾病类型:早产儿视网膜病变(ROP)
数据来源:Farabi Eye Hospital, Tehran University of Medical Sciences in Tehran(伊朗)
数据用途:用于早产儿视网膜病变的检测和研究
任务类型:分类
样本数量:1533
分类类别:3(Normal, Pre-Plus, Plus)
作者:Akbari, M., Pourreza, HR., Khalili Pour, E.
论文引用:Akbari, M., Pourreza, HR., Khalili Pour, E. et al. FARFUM-RoP, A dataset for computer-aided detection of Retinopathy of Prematurity. Sci Data 11, 1176 (2024). https://doi.org/10.1038/s41597-024-03897-7
论文下载:nature s41597-024-03897-7
数据集下载:figshare 6721269
版权声明:
youcans@xidian 作品,转载必须标注原文链接:
【医学影像AI】50个眼科影像数据集(1)分类任务
Copyright 2025 youcans, XIDIAN
Crated:2025-02