孤独症谱系理论:机器学习在自闭症儿童早期识别和诊断领域的应用

发布时间:2024-04-27 分类:自闭症论文 浏览量:140

孤独症谱系理论:机器学习在自闭症儿童早期识别和诊断领域的应用插图-西米明天

来 源:心理科学进展2022,Vol.30,No.10,2321–2

作 者:侯婷婷1陈潇2孔德彭2邵秀筠3林丰勋1李开云1

(1济南大学教育与心理科学学院,济南250022)

(2浙江工业大学教育科学与技术学院,杭州310023)(3青岛市晨星实验学校,青岛266000)

摘要 早发现、早诊断、早干预是开展自闭症儿童教育康复工作的共识,但传统识别和诊断方法局限及专业人员缺乏常导致自闭症儿童错失最佳干预期。为改善现状,近年来机器学习凭借其客观准确、简便灵活等方面的优势,逐渐被应用到自闭症的早期预测、筛查、诊断和评估过程管理中,积累了较为丰富的成果。但是机器学习也在研究对象选取、分类数据采集和理论模型应用等方面存在局限性。未来研究应推动构建孕产期和新生儿病理生理信息追踪数据库和标准化模型分类指标体系,同时继续优化算法,加快智能化自闭症识别和诊断理论成果向实践转化。

关键词机器学习,自闭症,早期识别与诊断,系统综述

分类号R395

1引言

随着智能时代的到来,人工智能(ArtificialIntelligence,AI)与特殊教育的深度融合已经成为教育发展的重要趋势(郭利明等,2019)。众多研究者致力于将人工智能技术与不同类型、不同障碍程度特殊教育需要儿童的需求相匹配,为他们提供更具个性化、精准化的教育康复与医疗诊治服务,进一步改善其生活和学习质量。随着技术的不断成熟,自闭症谱系障碍(AutismSpectrumDisorders,ASD)这一数量庞大、病因复杂群体受到了智能教育界的广泛关注,围绕为自闭症实施行之有效的干预这一焦点问题展开了一系列的探讨,其中科学准确的早期识别和诊断作为教育干预开展的前提,不可避免地成为了研究与实践中必须面对和亟待解决的关键问题。

根据美国疾病预防和控制中心数据显示,2021年自闭症谱系障碍的发病率为1/44,与2000~2002年的1/150相比,患病率增加了近240.9%(Maenneretal.,2021)。面对不断攀升的患病率和尚不明确的发病机制,自闭症已演变成为全球性重大公共卫生问题。积极开展早期预防、识别和干预是应对这一挑战的重要举措。然而目前很少有专门面向ASD群体的大范围患病风险筛查,ASD诊断也主要依靠外在的行为观察与评估人员的主观经验判断。常规诊断流程是评估人员依据标准化诊断工具(如DiagnosticandStatisticalManualofMentalDisorders-4/5thed.,DSM-IV/DSM-V;InternationalClassificationofDiseases,ICD)对儿童进行评定,评定方式包括心理和教育测量、医学检查、家长或监护人访谈、日常观察等,操作费时,对于评估人员具有极高的专业理论知识和临床经验要求。但现实情况是,国内具备诊断资质的专业人员非常少,即使是在特殊教育发展相对靠前的一些国家,如美国,能够进行ASD诊断的儿科医生也仅占全体医生8%的比例(陈顺森等,2011),专业诊断“一号难求”。有研究显示,尽管自闭症儿童的行为症状早在1~2岁就能表现出来,但典型自闭症诊断的平均年龄却在4岁以后,轻度自闭症的诊断年龄在5.6~8.6岁(Sheldricketal.,2017),高功能自闭症甚至要延迟到11岁以后(Guinchatetal.,2012), 儿童被迫陷入“等待失败”的痛苦中。另外这种完全基于外在行为的、主观的诊断纳入的参考变量有限,缺乏客观一致的神经科学指标,误诊、漏诊时有发生(Klinetal.,2000),一部分儿童被错误地贴上了自闭症的标签,严重违背了评估诊断的初衷。最令人担忧的是,这些问题会严重阻碍自闭症患者早期干预,延误教育康复的黄金时段,给自闭症儿童及其家庭带来巨大的心理和经济负担。最后,即使自闭症儿童诊断完成,后续基于这些患者表现进行的病因、症状研究仍属于回溯性分析,很难全面客观地总结ASD行为特征,提取可表征潜在生理机制的标记物,筛选出和临床预测相关度比较高的特征。这使得我们在自闭症儿童防治工作中一直处在被动状态。

机器学习(MachineLearning,ML)作为人工智能的核心,是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的技术(余明华等,2017)。该技术自动生成的规则不受个体主观经验的影响,对于提升分类的特异性、敏感性、准确性和增加分类效率都具有重要意义。此外,机器学习可以提取大量数据中细微的、潜在有用的信息,并利用这些信息创建一个针对当前问题的预测或分类模型,特别适用于洞察复杂问题的内在规律,帮助尽早发现可能病因,提高自闭症的生活质量(崔建伟等,2021;李航,2012;Hosseinzadehetal.,2021)。国内外学者将其应用于多种精神与神经系统疾病的分类、诊断、治疗和预后管理中,在自闭症群体的预测、识别和辅助诊断实证研究中也取得了大量有价值的成果,但国内在该方面的研究报告相对较少。本文就机器学习在自闭症儿童早期识别和诊断中的应用进行综述,以期为国内相关研究与实践提供参考。

2研究方法

采用国际上广泛使用的系统性文献综述和元分析方法(PreferredReportingItemsforSystematicreviewsandMeta-Analyses,PRISMA)来确定纳入研究的论文构成。该方法包括4个文献筛选阶段,共计27条综述项目。4个阶段分别为检索、初筛、纳入和综合,综述项目包括文献标题、摘要、研究目的、研究方法和研究结果等(Moheretal.,2009)。考虑到近年来计算机科学技术发展迅猛,更新换代速度极快,本文选取近5年来机器学习在自闭症儿童早期识别和诊断领域文献,具体检索日期范围为2016年1月1日~2021年4月29日。应用的英文主题词为:“Autis”“Prediction”“EarlyScreening/EarlyDetection/EarlyIdentification/EarlyRecognition”“EarlyDiagnosis”“MachineLearning/ArtificialIntelligence”,在EBSCO、ElsevierScienceDirect、SAGE、WebofScience、Springer五个综合性外文数据库进行检索,限定检索范围为同行评议(Peer-reviewed)期刊,获得520篇文献,通过参考文献引文检索又获得50篇文献,共计570篇。作者共同阅读文献的标题、摘要及正文,删除重复、不符合既定标准的论文,最后获取纳入综述的文献60篇。

文献纳入标准:(1)文献为英文实证期刊论文,全文可得且文章不少于3页;(2)研究对象中至少包含1名ASD儿童(在本文中,对儿童的界定参照国际《儿童权利公约》,即儿童指18岁以下的个体),且具有明确的被试统计学变量(年龄)或“儿童”标注2;(3)研究包含明确的研究问题、方法和结论,研究结论有详实的数据支撑;(4)研究主题聚焦ASD儿童的早期识别或诊断,在摘要或关键词中明确表明采用机器学习技术进行分类。

排除标准:(1)非英文文献(韩语、德语、西班牙语等)、综述、书籍章节、会议记录和专利等文章,以及少于3页的文章;(2)研究对象全部为18岁以上的成年人、老年人或其他特殊群体;(3)研究问题、研究设计或研究结论模糊不清,结论没有数据支撑;(4)与ASD无关的精神疾病研究以及未应用机器学习方法的研究。这些标准是在文献搜索之前确定的,以减少在文献筛查期间的潜在偏见。

最后,基于徐建平和张厚粲(2005)提出的“归类一致性公式”检测编码信度,由前两位作者共同计算出纳入综合分析的文献评分者信度在0.50~1.00之间,总的归类一致性为0.812;编码信度系数值在0.75~0.80之间,总体编码信度系数为0.759,表明研究文献具有公平到良好的一致性水平。

3基于机器学习的自闭症早期识别和诊断研究数据类型与采集

机器学习可以通过对已有数据的抽象,发现数据的隐藏规律(董健宇等,2020)。因此数据是模型建立的源头性因素,建模的第一步就是数据收集。

3.1数据构成

ASD儿童本身异质性高,数据结构性不强,因此分类模型的原始数据一般为二分类数据。从被试构成看,研究者一般同时设置实验组和对照组,选取ASD及与其生理年龄、智力年龄等相匹配的其他发展障碍或典型发展儿童(typicallydeveloping,TD),其中障碍儿童常见类型有注意缺陷多动障碍(AttentionDeficitHyperactivityDisorder,ADHD)、发展迟缓(DevelopmentalDelay,DD)、儿童失语症(ChildhoodApraxiaofSpeech,CAS)和其他神经发育障碍(Otherneurodevelopmentaldisorder,OND)。也有研究根据儿童未来患自闭症风险的程度分为高风险(HighRisk,HR)和低风险(LowRisk,LR)组。从被试年龄范围看,涉及个体发展的各个阶段,筛查和诊断的最早时间基本上在3岁以内,处于婴儿期和幼儿期阶段。自闭症风险预测研究时间更早,一般在1岁之前,也有研究提前到孕产期和新生儿时期,但这类研究很少。从被试来源看,涉及美国、英国、法国、中国、伊朗、新西兰、印度、意大利、韩国、西班牙、澳大利亚等数十个国家和地区,常见的数据采集渠道有自闭症研究公开数据库(见表1)、医院、特殊教育学校或康复中心和少量的在线搜索引擎(如雅虎问答,谷歌搜索)等。不同研究包含的样本数量差异很大,从几十到上千分布不均,其中样本量超过300人的研究数据基本上来自于公开数据库。自闭症研究公开数据库是研究者为帮助不同学科、不同专业工作者开展合作研究设置的开放资源库,其储存的大规模数据为使用机器学习开展自闭症识别和诊断带来极大便利。以使用频率最高的ABIDE(AutismBrainImagingDataExchange)数据库为例,该数据库整合全球多个实验室收集ASD和TD儿童以脑结构和功能影像为主的研究数据,免费向科研人员提供,现已采集完成两期数据,被试数量超过2200名,网站注册研究人员涵盖北美洲、欧洲、非洲、亚洲等多个国家和地区。

机器学习技术的运用突破了传统回溯性研究的局限,自闭症识别和诊断的年龄得以在一定程度上缩短,通过复杂运算提取的隐藏规律还可以被应用到孕产期和新生儿检查中,帮助及早发现高危因素,为早期干预争得时间,但遗憾的是目前这类研究并不多见。除此之外,机器学习技术使大范围、多指标、跨文化数据收集成为可能,从独立小样本数据到跨地区的自闭症公开共享数据库,有效提高了研究的外部效度,也为更深层次自闭症成因挖掘和成功预防提供依据。但应该注意的是,当前的公开数据库多来自于单位或个人研究,数据采集的目的和标准并不一致,样本信息整合缺乏同质性,训练集与测试集之间可能出现偏差,模型的推广问题还需进一步验证。

表1自闭症研究公开数据库

3.2数据采集

样本选定后就可以启动数据采集工作。近年来数据采集方式和类型因技术更新而更为多样,例如基于脑电信号和成像技术采集生理信号数据(Nogay&Adeli,2020;Pagnozzietal.,2018)、借助量表和观察、访谈、眼动技术等收集行为数据(Boneetal.,2015)。机器学习识别和诊断是基于可以反映自闭倾向的特征及各种神经标志物来进行判断,目前主要有年龄、性别、种族等人口统计学资料,目光对视、社会性微笑、模仿等典型症状表现,儿童个人及家庭病史等临床资料,以及功能性磁共振成像、结构性磁共振成像、脑电图、超声波等生理信号数据(见表2),以及不同数据类型组合而成的多模态数据。

3.2.1基于影像分类

基于脑成像、超声波成像、视网膜成像等生物标记作为机器学习技术的输入特征可以为自闭症分类提供客观证据,因此在研究中应用最为广泛(Abrahametal.,2017;Calyetal.,2021;Laietal.,2020)。fMRI的高时间分辨率有助于对大脑特定区域皮层活动的精准定位。sMRI空间分辨率较高,能够客观地记录不同个体相同脑组织成分间的差异。有学者提出自闭症分类研究中同时采用这两种技术效果最好。如Raki?等(2020)采集了ABIDE-I数据库中817名7~64岁被试sMRI和静息态fMRI(restingstatefMRI,rs-fMRI)影像,通过Fisher算法对特征向量(featurevectors)降维,降维后的特征向量作为分类器的输入信息,最后采用栈式自动编码器和多层感知机算法进行识别,准确率最高可达85.06%。Sen等(2018)的研究也发现同时使用两种技术作为特征输入识别ASD和TD的效果最佳。但是也有研究显示单独采用fMRI或sMRI的影像也能够实现自闭症个体的准确识别(Eugeniaetal.,2020;Katuwaletal.,2016;Plittetal.,2015)。Guo等(2017)收集了ASD和TD的rs-fMRI数据,发现经过特征选择的深度神经网络分类准确率可达86.36%。脑电造价较低、使用方便,可以为自闭症儿童识别提供脑神经细胞电生理活动反应证据。有研究使用EEG技术实现了对3个月月龄(Dickinsonetal.,2020)和3~14岁(Abdolzadeganetal.,2020;Grossietal.,2017)自闭症儿童识别,表现良好。

3.2.2基于量表/问卷分类

传统标准化测量工具汇聚了临床专家丰富理论知识和扎实的实践经验,是自闭症儿童筛查和诊断的“金标准”,可以为机器学习模型构建提供有力证据。基于传统测验工具进行识别和诊断的形式有两种。第一种是将传统标准化测验所得结果借助机器学习技术进行数据分析,探究分类准确性。Abbas等在2018和2020年两项研究中均将ADOS和ADI-R中常用的行为模块作为分类器输入信息,提出了一种基于机器学习的多模块自闭症评估方法。该方法包含3个模块,一是家长问卷,二是儿童家庭录像中标记的关键行为,三是临床问卷。通过随机森林、L2正则化逻辑回归和梯度提升决策树对18~72个月的儿童进行分类,发现当同时使用模块一和二,并设置不确定性结果变量(InconclusiveResultsVariant,≤25%)时,分类准确率高于98%,三模块联合时准确性达92%。即使是三模块共用,测试总时长也仅在15分钟左右。也有研究者基于AQ-10(儿童/青少年/成人版)和幼儿自闭症量化检核表(QuantitativechecklistforautisminToddlers,Q-CHAT),设计移动筛查程序ASDTests(Thabtah,2019)和AutismAI(Shahamiri&Thabtah,2020)对自闭症儿童进行预测,ASDTests识别准确率最高可达99.85%,时间仅需3~5分钟。

第二种是机器学习算法通过对传统标准化量表或问卷的项目删减,筛选出最具代表性的问题构建分类器(Levyetal.,2017)。如Duda,Daniels和Wall(2016)通过逻辑回归等算法发现,当从ADI-R的93个条目中筛选出7个关键项目或单独选用ADOS第2、3维度作为分类依据时,对自闭症儿童分类准确率达到了99%,测试时间缩短到十几分钟。Duda和Ma等(2016)以及Duda等(2017)还以SRS量表中的5种典型行为和15个衍生问题构建分类器,分类性能均达到预期(AUC>93%,AUC=89%)。值得注意的是,近一半基于量表分类的文献是同时采用两种或两种以上工具,希望通过不同测验的融合,获得更佳分类效果。

3.2.3基于行为分类

自闭症儿童典型行为表现在发展早期就可以直接观测到,可以为分类模型构建提供外显指标。社交障碍和重复刻板行为是ASD诊断的核心标准,可作为行为指标分类的重要依据。Qiu等(2020)采用静态面孔范式(Still-FaceParadigm,SFP)将HR-ASD和TD非社会性/社会性微笑、反抗行为、目光交流和积极社交参与的频率和持续时间作为模型分类指标。Negin等(2021)构建了HR-ASD儿童扩展性刻板行为数据库(ExpandedStereotypeBehaviorDataset,ESBD),通过旋转、拍打手臂、手部动作和头部撞击4个动作实现与TD的区分。眼动仪可以记录人在处理视觉信息时的眼动轨迹特征,眼动行为是基于机器学习进行自闭症分类的最常用行为指标,具体指标包括注视时长和注视频率。Wan等(2019)采用SMIRED250便携式眼动跟踪系统,记录4~6岁的ASD和TD在观看一段10秒钟的女性演讲视频时对不同身体部位的注视时长,并采用支持向量机构建分类器,发现儿童对演讲者口部和身体的注视时长差异可以有效区分ASD和TD(Acc-=85.1%,Sen-=86.5%,Spe-=83.8%)。除此之外,部分自闭症群体存在运动障碍,有研究显示姿势控制和上肢运动等指标也可以作为早期分类的依据,其应用准确性可以达到90%以上(Lietal.,2020;Wedyanetal.,2019)。

3.2.4基于多模态数据分类

“多模态”是指表征意义的符号系统或有效手段的多样性(顾曰国,2013),多模态数据则是指混合多种分类方法、分类指标实现研究目的,在本研究中则指将量表、影像、行为等单一模态的数据采集方式进行整合,同时采用两种或两种以上方法用于自闭症分类模型构建(Gengetal.,2020)。Kang等(2020)收集3~6岁ASD和TD的rs-fMRI数据和对本民族和其他种族人类面孔反应的眼动指标,结合支持向量机的最小冗余?最大相关(minimumredundancymaximumrelevance,MRMR)特征选择方法对被试进行分类,发现脑电和眼动数据同时作为分类器数值输入时,分类准确率达到85.44%,AUC超过93%,远高于仅依照单一行为指标分类66.9%的准确率。Bosl等(2018)纵向追踪高低风险ASD在3~36个月间的脑电数据,在36个月时采用ADOS测量参与者的自闭症症状严重程度,结果发现3个月大婴儿的脑电数据可以预测其3岁时的ADOS得分。韩保祯(2018)也发现多模态信息融合的脑网络数据对于ASD和TD分类效果最好。

机器学习应用于自闭症早期分类研究数据类型从单一模态扩展到多模态,分类指标类型越来越多样;采集方法从外显的行为指标到内部神经标记,技术也愈发客观全面。数据采集方式和类型的丰富可以在源头上助力模型构建,为最佳分类效果的获得提供基础。但我们也应该看到,目前数据采集还存在几个问题需要改善,首先影像技术手段比较单一,主要是fMRI和sMRI,ERP、fNIRS等技术在该领域的应用较少。其次,传统诊断工具本身是经过系统设计的,每个模块有固定目的,不同机器学习方法中对于项目或模块删减标准不一,得到的结果并不统一,工具删减的依据和标准缺乏规范性讨论。传统工具测量时长是为了保证施测过程更为细致准确,机器学习将时间缩短到十几分钟,是否有可能出现信息遗漏导致结果偏差也是一大问题。最后,基于典型行为的分类指标过于广泛,基于DNA、RNA等遗传物质的研究却并不多见,不同研究者关注的重点有很大差异,如何在众多指标中选出最具代表性的一种或几种指标仍然值得商榷。这些都是我们在应用机器学习实现自闭症分类之前需要广泛探讨和论证的问题。只有真正解决源头性问题,才有可能将技术的优势真正落实在自闭症群体身上。

4基于机器学习的自闭症早期识别和诊断研究算法与流程

4.1机器学习算法

算法是模型建立的技术性要素。机器学习算法的分类非常广泛(Hydeetal.,2019),基于学习方式不同可分为有监督学习、无监督学习、半监督学习和强化学习,按照模型结构的深度又分为传统机器学习和深度学习。目前在自闭症早期识别中的应用以传统算法为主,包括支持向量机(SupportVectorMachine,SVM)、决策树(DecisionTree,DT)、K最近邻(K-NearestNeighbours,KNN)、朴素贝叶斯(NaiveBayes,NB)、回归(Regression)、随机森林(RandomForest,RF)和梯度提升决策树(GradientBoostedDecisionTrees,GBDT)等(Ben-Sasson&Yom-Tov,2016;Meeraetal.,2020;Parikhetal.,2019)。一些改进算法也有使用但数量不多,如功能性随机森林(FunctionalRandomForest,FRF)、改进的蝗虫优化算法(ModifiedGrasshopperOptimizationAlgorithm,MGOA)、多层模糊认知图(MultilayerFuzzyCognitiveMap,MFCM)、ASD-DiagNet和规则性机器学习(RulesMachineLearning,RML)等(Eslamietal.,2019;Feczkoetal.,2017;Goeletal.,2020;Puertoetal.,2019;Thabtah&Peebles,2019)。但近年来随着技术的不断发展,人工神经网络(ArtificialNeuralNetwork,ANN)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)、深度神经网络(DeepNeuralNetworks,DNN)、前馈神经网络(FeedforwardNeuralNetwork,fNN)和多层感知机(MultilayerPerceptrons,MLP)等深度学习新方法也逐渐受到了研究者的关注(Achenieetal.,2019;Enietal.,2020;Raj&Masood,2020)。

SVM是传统机器学习代表性算法之一,特别适用于二分类数据问题(Junetal.,2019;Lietal.,2018;Rrticoetal.,2016)。Liu等(2016)的研究采用径向基核函数(RadialBasisFunctionkernel,RBFkernel)将非线性数据投影到高维空间,使数据实现分离,有效区分了ASD和TD,准确率达88.51%。但有研究显示,SVM等传统算法往往直接根据特征对样本进行分类,不进行或只进行一次特征变换和选择,过于依赖上游提供的特征,存在对缺失数据敏感和多分类问题处理过拟合问题,在面对自闭症这一成因和表现复杂群体时,效果存在局限(Namdeo&Singh,2021;杨剑锋等,2019)。深度学习无需借助上游特征,可以将大量原始数据直接输入模型,通过对数据的多次变换检测计算出抽象特征帮助分类(胡越等,2019),模型的分类性能和泛化能力也较传统方法有所改善(Dubreuiletal.,2020;Lietal.,2019;Quaaketal.,2021)。Salari等(2019)以及Sewani和Kashef(2020)以rs-fMRI数据为分类指标,运用SVM、KNN、RF和CNN分别构建分类器,发现CNN(70.22%;84.05%)的分类准确率高于SVM(69.35%;69.1%)、KNN(62.11%;60.1%)和RF(59.94%;65.3%)。Dong等(2021)以静息态脑电图为分类指标构建的CNN模型,分类准确率更是达到了92.63%。Yang(2020)的研究也得到了同样的结论。此外人工神经网络作为深度学习的基本组成部分,也被证明具有较高的分类准确度。Grossi等(2017)

基于ANN搭建了一种新型分类系统,将多比例尺分级组织图与时间压缩的隐函数(Multi-ScaleRankedOrganizingMap,MS-ROM/ImplicitFunctionasSquashingTime,I-FAST)算法相结合,以脑电图像为判别指标,发现该算法对ASD预测准确率高达100%。但也有研究显示,传统算法可以通过增加分类器数量进行自我优化。随机森林将bootstrap再抽样和决策树算法相结合,构建树型分类器集合(曹正凤,2014),分类速度、准确性和抗噪性能明显高于单一分类器算法,还可以在一定程度上减轻过拟合问题。Wingfield等(2020)开发的ASD筛查程序,发现RF相较单一的NB、DT分类效果明显优化,AUC达到98%。

机器学习算法无需明确编码,可以自动检测数据中存在的模式,处理复杂的非线性数据,相比传统识别和诊断方法具有强大的功能优势。近年来在ASD分类研究中的应用还呈现出从传统算法向深度学习过渡的趋势,诊断效率大幅提升。但目前超过75%的研究使用的仍是传统机器学习算法,对于深度学习的关注有待提高。此外当前研究中算法众多,不同研究者使用的算法存在很大差异,同一算法对不同对象施测结果也有不同,对于最佳算法的争议一直没有停止。因此未来研究应继续深入探讨如何找出最佳算法,更大程度发挥技术的价值。

4.2机器学习效果评价

效果评价是模型构建的指挥棒和导航塔。数据收集和算法选择后,需要对模型有效性加以验证。机器学习效果评价一般是以专业医师诊断为校标,计算相关系数或成功预测比例得到的。根据原始二分类数据特征,一般将分类效果分为正类(Positive)和负类(Negative),其中真阳性和真阴性是预测良好中的正类和负类,假阴性和假阳性是预测不良中的正类和负类(见表3)。具体的模型性能评价指标包括:(1)准确率(Accuracy,Acc-),是指分类正确的样本数占总样本数的比例。通常来说,准确率越高,分类效果越好。计算公式为Acc-=(TP+TN)/(TP+FN+FP+TN);(2)敏感度(Sensitivity,Sen-),指正类中自闭症儿童分类正确的比例,又称召回率(recall)、真阳性率(TruePositiveRate,TPR)。计算公式为Sen-=TP/(TP+FN);(3)特异度(Specificity,Spe-),指负类中自闭症儿童分类正确的比例,又称真阴性率(TrueNegativeRate,TNR)。计算公式为Spe-=TN/(FP+TN);(4)接收者操作特性曲线(operatingcharacteristiccurve,ROC曲线),是一种以假阳性率为X轴,以真阳性率为Y轴组成的图形,主要通过计算ROC曲线下面的面积(AreaUnderROCCurve,AUC/AUROC)对分类性能进行比较。一般来说,AUC/AUROC越大,分类效果越好。除上述4种常用指标外,部分研究还采用了阳性预测值(PositivePredictivevalue,PPV)、阴性预测值(NegativePredictivevalue,NPV)、错误率(falsediscoveryrate/errorrate,FDR)等指标来考察分类器效果。

4.3机器学习流程

逻辑清晰、完备有序的数据处理流程是模型有效落实的显性表现。机器学习应用于ASD早期识别和诊断大致经过以下4个步骤:首先是收集数据阶段,也就是选择ASD分类所需影像、量表、行为等数据指标。其次是原始数据处理阶段。该阶段主要目的是实现特征选择,通过过采样、欠采样等方法对重复记录、缺失值和不平衡数据进行降噪,降低计算复杂性和提高分类精度,形成分类所需数据集(Rahmanetal.,2020)。然后就进入自闭症和对照组分类阶段。该阶段通常会采用k折交叉验证将整个数据集随机分为k份,其中1份作为测试集(testingset),k-1份用于训练,其中训练的数据又可以随机分为训练集(trainingset)和验证集(validationset),这样交叉验证k次,每一份都可以作为测试集进行测试,平均k次的结果,得到最终结果。具体流程又可简述为:第一,输入训练集,采用机器学习算法进行训练,构建ASD分类模型;第二,将验证集输入模型中,比较模型预测结果和“自闭症”标记数据的区别,验证模型分类准确性;第三,测试集测评模型分类性能。最后获取最佳分类模型。Epalle等(2021)构建的DNN模型就是遵从了这一程序,借助ABIDE-I中的脑成像数据区分ASD和TD。数据处理阶段利用过采样进行特征选择,使CC200集增加19900个特征,AAL90集增加4005个特征,DOS160集增加12720个特征;在分类阶段,采用10折交叉验证(10-foldcross-validation)、5折分层交叉验证(5-foldsstratifiedcross-validation)和留一法(Leave-one-site-out)构建分类器和评估分类结果,在每一部分数据中,设置70%用于训练,20%用于验证,10%用于测试。最后模型验证结果显示该分类器对两组被试的分类准确率可达78.07%。

机器学习应用于ASD儿童分类自动分配训练集和测试集,经过过滤和反复检测选择和提取数据特征,发现数据隐藏规律,从来源上减少了数据偏差,增加了研究的内部效度。模型有效性的验证范围涵盖Acc-、Sen-、Spe-、AUC、PPV和NPV等多个维度,越来越注重对于模型的客观测量,也在一定程度上增加了研究的外部验证。但是通过文献汇总也能够看出,目前研究中采用的分类指标组合大相径庭,指标报告的数量参差不齐,缺乏较为一致、普遍被大家认可的分类效果指标体系。另外,Falkmer等(2013)认为自闭症分类模型的准确率应至少达到或高于80%才可以被视为达到了要求,但当前部分研究的准确率甚至不足60%,距离分类准确率的要求还相差不少(Bussuetal.,2018)。后续研究如何从技术层面上继续优化和规范这些问题,还需要更深入的探讨。

5基于机器学习的自闭症早期识别和诊断研究应用

5.1预测自闭症患病风险因素

自闭症作为一种病因不明的神经发育障碍,仅仅依靠常规的产前检查无法达到预防目的。机器学习技术可以通过广泛收集影像和生物指标信息,充分挖掘和汇总信息,计算得出具备预测功能的数据模型,实现对自闭症患病风险的有效预测(刘笑晗等,2022),为自闭症病因探索与综合诊疗提供新的方向。

孕产期环境和母体自身健康因素都有可能影响胚胎发育质量,产前对于孕妇(尤其是高风险孕妇)和胎儿的医学检查与监护可能有助于发现自闭症风险因素。机器学习可以通过对超声波检查、羊膜腔穿刺、X射线检查、绒毛细胞检查、胎儿镜检查等收集的影像信息和生物标记物信息,推测ASD患病影响因素。如Caly等(2021)通过收集胎儿的超声波测量值(包括股骨长度、头围、腹围等)和生物学特征(如IgG巨细胞病毒水平等)预测新生儿患自闭症的风险,采用最小绝对收缩和选择算法(LeastAbsoluteShrinkageandSelectionOperator,LASSO),DT和极端梯度提升(eXtremeGradientBoosting,XGBoost)算法构建分类模型,研究结果显示模型阳性预测值可达77%。母体免疫性疾病家族史、母体对巨细胞病毒的免疫力、孕晚期胎儿股骨长度、孕晚期胎儿白细胞数量、新生儿心率和性别等10项指标可以作为ASD预测标记物。基因是决定生命健康的内在因素。基因检测可以提取细胞中的DNA分子信息,确定新生儿基因类型和缺陷。机器学习技术通过梳理复杂的遗传信息,可以帮助发现与自闭症患病有关的遗传因素。Bahado-Singh等(2019)利用450k甲基化芯片(InfiniumHumanMethylation450BeadChip)检测ASD和TD新生儿血斑中的白细胞DNA,发现在胞嘧啶基因中CpG位点甲基化异常显著,预测结果AUC为100%。同时研究者还发现自闭症在EIF4E、FYN、SHANK1、VIM、LMX1B、GABRB1、SDHAP3和PACS2基因中存在表观遗传调控障碍。Oh等(2017)以及Sekaran和Sudha(2020)研究也证明外周血基因表达谱(geneexpressionprofiles)和FAM104B、CCNDBP1、H1F0、ZER1等生物标记能够实现对ASD个体的分类和预测,其准确率分别可达93.8%和97.62%。还有学者报告长链非编码RNA(longnon-codingRNA,lncRNA)也能够用于预测新生儿罹患ASD风险(AUC=83.9%;G?k,2018)。Qiu等(2020)基于SVM构建的预测模型显示,一碳单位代谢(folate-dependentonecarbonmetabolism,FOCM)、转硫作用(transsulfuration,TS)中的多种代谢物以及母体孕前和孕期摄入的叶酸含量也可以作为新生儿自闭症风险预测的指标,该模型预测的准确率达到96%以上。借助机器学习对HR-ASD家族婴儿的大脑功能连接磁共振成像(functionalconnectivityMagneticResonanceImaging,fcMRI)进行追踪研究,将ASD风险预测年龄提前到了胎儿出生后6个月(Emersonetal.,2017)。

5.2筛查高危自闭症

早期自闭症筛查可以在大范围人群中发现高危儿童,对于改善自闭症儿童社会适应、预防继发性发育障碍和减轻家庭与社会负担具有重要意义(陈光华等,2022)。如果筛查工作可以直接由家长或其他熟悉儿童的人员操作,就可以更早发现潜在ASD患者,避免错失干预时机。Thabtah等(2018)借助机器学习模型简化传统量表(CHAT、AQ),开发了一款适合ASD筛查的移动应用程序——ASDTests,该工具可以在手机端免费下载使用,适用范围涵盖婴幼儿期(1~3岁)、儿童期(4~11岁)、青少年期(12~16岁)和成人期(17岁之后)四个阶段,每个阶段仅有10道测试题,测试时间在3~5分钟以内,非专业人员也能轻松操作。研究发现该程序对于儿童、青少年和成人阶段HR-ASD的筛查灵敏度、特异性和准确率均高于95%,分类性能良好(Thabtahetal.,2019)。Raj和Masood(2020)基于个体性别、种族、是否先天黄疸等21项特征构建自闭症筛查模型,发现CNN在儿童、青少年和成人群体中筛查的准确率分别可以达到98.30%、96.88%和99.53%,能够快速地在大范围人群中找出自闭症患者。除此之外,神经影像数据和行为表现作为风险识别重要的内外部参照,也被广泛应用于筛查或诊断模型的构建,取得了令人满意的效果(Dickinsonetal.,2020;Laietal.,2020;Qiuetal.,2020;Raki?etal.,2020)。

5.3辅助诊断自闭症

诊断是对筛查出的高危儿童做更全面细致的专业检测。传统诊断方法通过观察儿童外在行为和家长报告方式获取数据,易受评估人员主观性和报告者回忆偏差影响。诊断过程中存在的等待周期长、误诊等问题也阻碍了后续临床干预的实施。机器学习辅助专业人员诊断可以纳入大量客观分类指标,在一定程度上减少主观施测弊端,还能够减少耗时,降低等待成本。社交机器人是ASD智能诊断中的常用工具,其设计有趣亲切,通过丰富的面部和肢体语言与受测者沟通,可以减少自闭症社交恐惧(黄碧玉,2018)。Ramírez-Duque等(2019)采用RGBD传感器采集HR-ASD和TD幼儿与ONO社交机器人互动的行为特征,并利用CNN构建两类儿童面孔识别模型,辅助专业人员对ASD儿童进行诊断,发现该模型可以实现ASD的自动化识别,花费时间不超过40分钟,准确性与临床专家诊断结果基本一致。Diehl等(2012)也发现社交机器人可以作为自闭症诊断和干预的有效工具。影像和传统量表也为机器学习辅助诊断提供了有效证据(Boneetal.,2016)。Tariq等(2018)以ADOS和ADI-R为指标构建的模型诊断准确率高于94%,灵敏度也超过90%。Abdolzadegan等(2020)对3~12岁的ASD和TD脑电图进行分析,基于SVM和KNN建立诊断模型,准确率达到94.68%。

5.4管理评估和干预过程

自闭症早期预测、识别和诊断的最终目的是为了给儿童提供行之有效的早期干预。收集自闭症群体评估和干预过程信息,追踪干预施行效果,可以为确定儿童生理病理机制和治疗靶点提供思路。然而传统的筛查、诊断、干预和预后再评是几个相对独立和分散的环节,难以对信息进行比较系统的收集和整合,也就更难发现和把握数据的内在趋势和隐藏特征,造成了数据的浪费。基于机器学习的分类一大优势还在于对数据的有效利用,在原有评估和干预数据基础上构建一体化智能评估和干预管理系统,增强对自闭症儿童诊断和干预的跟踪式监控(Koumpouros&Kafazis,2019)。Cognoa(CognoaASDScreener/CognoaASDDiagnosisAid)是一款以机器学习技术为支撑的新型ASD评估程序,兼具筛查、诊断和风险预测功能。该程序主要服务对象为婴幼儿至学龄前期自闭症儿童(18个月~5岁),需要家长完成一份包含15道题目的问卷,并上传两个以上时长1~2分钟的儿童日常生活视频(如用餐、游戏时间),资料上传完成后,后台自动评分输出风险值,整个过程约为15分钟(Kanneetal.,2018),每次测评结束程序会自动保存结果。2021年6月,美国食品和药物监管局(FoodandDrugAdministration,FNA)对该程序应用于自闭症患者诊断的可行性进行核定,发现来自14家医疗中心的425名儿童程序诊断结果与专家结论基本完全一致,获批准上市使用。基于机器学习技术建立的自闭症图片评估智能管理系统,还可以记录ASD从早期筛查到干预治疗过程中儿童能力变化数据,获得儿童预后再评信息(Pereraetal.,2017)。人工神经网络支持的专家系统,甚至可以在无预先编程设定的情况下机智应对和解决不确定性问题,为自闭症诊断和干预提供实时建议,是临床评估中的“得力助手”(靳宇倡等,2022;Neginetal.,2021;Rahmanetal.,2020)。

综上所述,机器学习在自闭症分类中的应用涵盖病因分析,患病风险预测,潜在危机人群筛查,辅助诊断和智能病程管理。这些工作的开展有助于增加从业人员对自闭症病因病程信息的掌握,实现筛查、诊断、干预和预后再评的动态化管理,节约长期随访所需的人力物力资源,更快找出众多个性因素中的“共性”,提高诊疗的有效性,这也是我们未来临床诊疗可以借鉴的一个思路。

6机器学习应用于自闭症儿童识别和诊断的优势与不足

6.1优势

目前机器学习技术已经应用于自闭症儿童早期预测、筛查和诊断,其客观性、便捷性和有效性经过了较为广泛的验证,分类性能在不断的优化和完善中也表现越来越好,部分智能工具也开始推广应用。相较于经验诊断和传统测量,机器学习的融入体现了人工智能技术的一些优势,集中表现在4个方面。第一,机器学习获取和整理数据指标的能力更强,有助于构建多模态分类模型。传统分类方法主要是通过对外显行为指标的观测得出结论,参考的变量有限,机器学习可以集合多种类型、不同观测方法获得的数据指标,兼顾内在和外部影响因素,减少主观误差,提高预测和识别结果的全面性和客观性。此外,机器学习模型还能够跟踪评估和诊断过程管理,增加了数据的利用率。第二,机器学习降低了预测和识别的时间成本,提高了测评效率,减轻诊断人员压力。分类模型的建立一方面可以通过大范围筛查,快速发现高风险自闭症患者,尽早引起家长和其他相关人员的警觉;另一方面还可以通过减少测试项目、缩短评测流程等有效压缩诊断时间,降低施测的等待时间,减少专业医师压力。第三,机器学习增加了研究的内外部效度。机器学习的建模过程和计算原理区别于传统方法,可以自动将原始数据分为训练集和验证集,无需数据生成模型和参数估计直接输入性能指标,模型还可以随样本数量累积不断优化,提升了研究的内部效度和外部推广力,也有利于加速模型应用于实践的速度。第四,机器学习可自动提取关键特征,帮助建立风险预警机制。机器学习可以捕捉肉眼无法观测到的细微表情或身势动作变化,减少关键指标的遗漏,还适用于非线性数据,可以从纷繁复杂的数据中心抽丝剥茧,更适合分析ASD这一类成因不明、结构复杂的疾病,降低症状恶化的可能。尤其是对于婴幼儿和学龄前期儿童,早发现、早干预能够发挥最大效益,帮助这些孩子及其家庭获得更高的生活质量,减少因障碍引发的各种社会适应问题。

6.2不足与展望

虽然机器学习在ASD儿童识别和诊断中具有一定的方法学优势,相关研究成果也逐步增多,但距离大范围应用还有一定距离,其面临的具体问题与可能的解决方法可总结为以下三个方面。

首先,缺少孕产妇和新生儿自闭症病源追踪研究。遗传学研究结果表明,常见的遗传变化,如基因突变、易位、倒位和拷贝数变异等都可能与ASD的产生存在一定程度的相关,患有ASD的新生儿拷贝数变异频率明显高于TD(Sandersetal.,2011)。也有研究报告ASD可能是由影响细胞增殖、迁移和许多其他基本过程的致病事件序列导致(Calyetal.,2021)。对自闭症儿童大脑的尸检报告也显示其前额叶皮层神经元异常过剩,还存在脑过度生长和巨脑问题(Tyzioetal.,2014)。Rahman等(2020)还发现父母的年龄、家庭病史也会增加新生儿患自闭症的风险。这些证据表明自闭症受遗传因素的影响,且这些病症在个体胚胎形成和发展时期可能就已经出现(Calyetal.,2021)。除遗传因素外,孕产妇暴露于危险环境也是自闭症患病的易感因素之一。Choi等(2016)研究发现,ASD发病率增加与母体病毒或微生物感染、发热以及免疫系统疾病有关。在孕期服用药物,特别是丙戊酸钠(sodiumvalproate),和维生素缺乏可能导致胎儿罹患自闭症。剖腹产、早产和新生儿并发症等问题也会增加ASD的发病比例(Cloarecetal.,2019)。这提示我们个体生命早期的内外部环境是导致自闭症出现的关键因素。

理清自闭症个体发展初期病理、病因和病程因素可能会为患病风险预测和防控提供新的契机,但遗憾的是当前文献研究中还很少有借助孕产期数据进行自闭症识别的研究。当前文献中仅有的两篇,Caly等(2021)采集了孕产妇从孕早期到胎儿出生后1天内常规生物标记物和超声测量值来预测自闭症,并与儿童4~5岁时诊断结果进行比较,预测准确率达到了77%。Bahado-Singh等(2019)采集249种新生儿(出生24~79小时)白细胞表观基因组标志物,成功预测了后期被诊断为自闭症的儿童(Sen-=97.5%,Spe-=100%)。这启示我们如果能在胚胎形成和新生儿发展初期,广泛收集孕产妇及其家庭成员健康信息,关注遗传和环境中可能的致畸因素,尤其是较为稳定的生物标记物,借助机器学习模型庞大的数据梳理功能提取其中的共性因子,是否就有可能逐步摆脱“被动等候”的局面,变为“主动防御”。因此未来研究可在遵循伦理原则的基础上,尝试借助孕期筛查和新生儿体检等环节建立儿童生理病理信息数据库,收集儿童(尤其是高危家族儿童)从胚胎期到出生期间的过程性信息,也可借鉴美国儿科学会的做法,在确保参与者知情同意的前提下于固定时间段(如出生时、出生后8个月、18个月等)进行长期追踪研究(Wanetal.,2019),获取自闭症个体发展初期病源的原始性资料,归纳可能的风险因素,及早规避和预防这一障碍的出现。

其次,缺少标准化模型分类数据体系。机器学习模型为海量信息处理提供了可能性,但技术本身对于数据的包容也可能成为一把双刃剑。现有机器学习分类指标虽然形式多样,但内容繁杂,缺少清晰明确的分类依据和系统化、规则化的应用效果分析,测评结果的可验证程度不高。以基于行为的单一模态分类指标为例,研究者所使用的具体指标包含了重复刻板行为、反抗行为、自我伤害行为、精细/粗大动作、社会交往行为、社会性微笑、共同注意、模仿、眼神变化、表达性和接受性语言等数十种行为表现。不同行为表现又可以细化为更微观的分类指标,仅眼神变化一项就可以分化出眼神检索(eyescanning)、眼神追随(eyetracking)和眼神接触(eyetouching/contacting)等多种范式。但是即使是同一行为表现,得出的结论也不完全一致(Shicetal.,2014;Wanetal.,2019)。基于量表的分类也出现了这一问题,研究文献中包含多种分类工具,不同工具蕴含的信息和施测对象也不一致。即使是同一测验工具,项目的筛选标准与结论也不完全统一(Emersonetal.,2017)。基于多模态的分类模型,在融合多元信息过程中混杂了更多与测评关联程度不高的信息,对测试准确性有一定干扰。多种模态的组合,同一模态不同分类指标的组合,为研究者提供了更多分类标准选择的同时,也带来了更多的测量误差,不利于研究结果的推广和泛化。

因此模型构建过程中应重视分类指标内部秩序性,梳理出分类指标选取的标准与依据,逐步确定出一部分稳定性强、适应范围广、准确度高的分类指标,构建更具科学性和稳定性的分类指标体系。有研究者提出,年龄可以作为分类指标划分的一个依据。Liu等(2016)的研究显示婴幼儿和儿童期ASD识别更适用于眼神交流、手势和面部表情等非语言行为特征,青少年ASD则更应侧重于和同伴的语言交流与情感互动。随着年龄增长,社会性沟通与情感联结成为更重要的分类指标。此外,大脑的变化经常出现在临床表现之前且具有较高的稳定性(Elsabbaghetal.,2012;Wolffetal.,2012;Wolffetal.,2015),因此分类过程中应特别重视客观影像指标的应用(Emersonetal.,2017;Hazlettetal.,2017;Itani&Thanou,2021)。言语智商、自闭症严重程度等经过验证的也较为容易收集的分类标准也可以直接纳入分类体系(Katuwaletal.,2016)。但是这类判别标准仍相对宽泛,无法完全满足自闭症特异性对指标选取的精细化要求。未来研究可在已有研究成果的基础上,一方面继续细化行为、量表、影像等指标适用范围,按照分类性能(准确性、稳定性等)对具体指标进行规则排序;另一方面应探究不同模态间如何有机结合、优势互补,兼顾自闭症患儿的内部神经机制和外在行为表现,更好地激发多模态数据隐藏的价值。

最后,理论模型向现实应用的转化还未完全成熟。机器学习可以帮助家长或其他从业人员提前知晓疾病风险,及早制定康复方案。但是现有研究仍停留在模型构建的理论阶段,模型应用到实践中还需要慎重思考以下几个问题。一是研究样本对总体的代表性。已有研究模型中选用的被试通常是经过选择的,多数为高风险自闭症家族人群,自闭症所占比重远超典型发展人群正常值(20%~33%;1%),评估结果若直接应用到普通人群中是否能够兼容(Rahmanetal.,2020;Thabtah,2019);二是模型的适用性和可推广性。受限于研究可行性因素,目前超过1/3的研究样本量不足300人,可能存在采样偏差,且很少有研究报告成果在不同文化背景、地理区域被试群体中的验证,理论模型的泛化能力还不能确定(Liaqatetal.,2021;Mazumdaretal.,2021)。三是算法的准确度和稳定性有待改善。当前模型仍多采用为传统机器学习算法,部分模型分类准确率尚不足60%,稳定性也难以满足大范围施测要求。四是模型功能较为单一。当前研究成果只能对个体是否为自闭症做简单的二分类判断,极少直接应用于诊断(Millaretal.,2019)。对于计算模型应用于预测和评估过程管理的功能也是浅尝辄止、不够深入。五是应用受众对模型的认可度仍需提高。当前ASDTests、Cognoa等操作简便的智能识别软件已经可以轻松地在手机端下载获得,上传视频或完成测试题目就可以快速获得筛查结果,但是绝大多数家长、教师甚至是相关专业从业人员并不了解这些软件。即使家长等相关人员知晓这些施测工具,关系到识别尤其是“诊断”结果,对于工具的认可和接受程度可能也难以达到研究者预期。对比传统方法,专业医师经过长时间观察和家长访谈,结合高度结构化量表慎重考量得出结果,仅ADI-R量表一项施测时间就长达2.5小时,过程蕴含大量自然真实环境中的人际互动线索(Abbasetal.,2020)。机器学习模型在缩短施测时间的同时能否得到真实有效的数据,预先设定的训练数据是否能完全覆盖测试对象,评估结果如何解释,评估结果如何应用于后续干预与康复,这些都是家长或其他应用受众会关注的问题。随着机器学习技术的不断成熟,上述问题更深入的思考与论证将有助于加快推进理论模型向实践转化的步伐。未来研究可在丰富研究对象和优化机器学习算法的基础上,充分调研不同受众的实际需求与困扰,有针对性的解决问题,同时增加对理论研究成果的宣导,在实践中不断加深理论模型的渗透与推广。

参考文献

*为纳入系统分析的文献

陈光华,陶冠澎,翟璐煜,白学军.(2022).自闭症谱系障碍的早期筛查工具.心理科学进展,30(4),738-760.

陈顺森,白学军,张日昇.(2011).自闭症谱系障碍的症状、诊断与干预.心理科学进展,19(1),60-72.

曹正凤.(2014).随机森林算法优化研究(博士学位论文).首都经济贸易大学,北京.

崔建伟,赵哲,杜小勇.(2021).支撑机器学习的数据管理技术综述.软件学报,32(3),604-621.

董健宇,韦文棋,吴珂,妮娜,王粲霏,付莹,彭歆.(2020).机器学习在抑郁症领域的应用.心理科学进展,28(2),266-274.

顾曰国.(2013).论言思情貌整一原则与鲜活话语研究——多模态语料库语言学方法.当代修辞学,(6),1-19.

郭利明,杨现民,段小莲,邢蓓蓓.(2019).人工智能与特 殊教育的深度融合设计.中国远程教育,(8),10-19+92-93.韩保祯.(2018).基于多模态信息融合的脑网络研究及其应用(硕士学位论文).电子科技大学,成都.

胡越,罗东阳,花奎,路海明,张学工.(2019).关于深度学习的综述与讨论.智能系统学报,14(1),1-19.

黄碧玉.(2018).社交机器人对孤独症儿童社交行为诱导效果研究(硕士学位论文).浙江工业大学,杭州.

靳宇倡,张政,郑佩璇,安俊秀.(2022).远程心理健康服务:应用、优势及挑战.心理科学进展,30(1),141-156.

李航.(2012).统计学习方法.北京:清华大学出版社.

刘笑晗,陈明隆,郭静.(2022).机器学习在儿童创伤后应激障碍识别及转归预测中的应用.心理科学进展,30(4),1-12.

徐建平,张厚粲.(2005).质性研究中编码者信度的多种方法考察.心理科学,28(6),1430-1432.

杨剑锋,乔佩蕊,李永梅,王宁.(2019).机器学习分类问题及算法研究综述.统计与决策,35(6),36-40.

余明华,冯翔,祝智庭.(2017).人工智能视域下机器学习的教育应用与创新探索.远程教育杂志,35(3),11-21.

*Abbas,H.,Garberson,F.,Glover,E.,&Wall,D.P.(2018).Machinelearningapproachforearlydetectionofautismbycombiningquestionnaireandhomevideoscreening.JournaloftheAmericanMedicalInformaticsAssociation,25(8),1000-1007.

*Abbas,H.,Garberson,F.,LiuMayo,S.Glover,E.,&Wall,D.P(2020).MultimodularAIapproachtostreamlineautismdiagnosisinyoungchildren.ScientificReports,10(1),1-8.

*Abdolzadegan,D.,Moattar,M.H.,&Ghoshuni,M(2020).ArobustmethodforearlydiagnosisofautismspectrumdisorderfromEEGsignalsbasedonfeatureselectionandDBSCANmethod.BiocyberneticsandBiomedicalEngineering,40(1),482-493.

*Abraham,A.,Milham,M.P.,Martino,A.D.,Craddock,R.C.,Samaras,D.,Thirion,B.,&Varoquaux,G(2017).Derivingreproduciblebiomarkersfrommultisiterestingstatedata:Anautismbasedexample.NeuroImage,147(15),736-745.

*Achenie,L.E.K.,Scarpa,A.,Factor,R.S.,Wang,T.,Robins,D.L.,&McCrickard,D.S(2019).Amachinelearningstrategyforautismscreeningintoddlers.JournalofDevelopmentalandBehavioralPediatrics,40(5),369-376.

AutismBrainImagingDataExchange(2017).RetrievedJuly3,2021,fromhttp://fcon_1000.projects.nitrc.org/indi/abide/abide_I.html

*Bahado-Singh,R.O.,Vishweswaraiah,S.,Aydas,B.,Mishra,N.K.,Yilmaz,A.,Guda,C.,&Radhakrishna,U.(2019).Artificialintelligenceanalysisofnewbornleucocyteepigenomicmarkersforthepredictionofautism.BrainResearch,1724,146457.

*Bone,D.,Bishop,S.,Black,M.P.,Goodwin,M.S.,Lord,C.,&Narayanan,S.S(2016).Useofmachinelearningtoimproveautismscreeninganddiagnosticinstruments:Effectiveness,efficiency,andmultiinstrumentfusion.JournalofChildPsychologyandPsychiatry,57(8),927-937.

Bone,D.,Goodwin,M.S.,Black,M.P.,Lee,C.,Audhkhasi,K.,&Narayanan,S(2015).Applyingmachinelearningtofacilitateautismdiagnostics:Pitfallsandpromises.JournalofAutismandDevelopmentalDisorders,45(5),1121-1136.

*Bosl,W.J.,TagerFlusberg,H.,&Nelson,C.A(2018).EEGanalyticsforearlydetectionofautismspectrumdisorder:Adata-drivenapproach.ScientificReports,8(1),6828.

*BenSasson,A.,&YomTov,E(2016).Onlineconcernsofparentssuspectingautismspectrumdisorderintheirchild:Contentanalysisofsignsandautomatedpredictionofrisk.JournalofMedicalInternetResearch,18(11),e300.

*Bussu,G.,Jones,E.J.,Charman,T.,Johnson,M.H.,&Buitelaar,J.K(2018).Predictionofautismat3yearsfrombehaviouralanddevelopmentalmeasuresinhighriskinfants:Alongitudinalcrossdomainclassifieranalysis.JournalofAutismandDevelopmentalDisorders,48(7),2418-2433.

*Caly,H.,Rabiei,H.,CosteMazeau,P.,Hantz,S.,Alain,S.,Eyraud,J.L.,BenAri,Y(2021).MachinelearninganalysisofpregnancydataenablesearlyidentificationofasubpopulationofnewbornswithASD.ScientificReports,11(1),6877.

Choi,G.B.,Yim,Y.S.,Wong,H.,Kim,S.,Kim,H.,Kim,S.V.,Huh,J.R(2016).Thematernalinterleukin17apathwayinmicepromotesautism-likephenotypesinoffspring.Science,351(6276),933-939.

Cloarec,R.,Riffault,B.,Dufour,A.,Rabiei,H.,GoutyColomer,L.A.,Dumon,C.,BenAri,Y(2019).Pyramidalneurongrowthandincreasedhippocampalvolumeduringlaborandbirthinautism.ScienceAdvances,5(1),eaav0394.

Diehl,J.J.,Schmitt,L.M.,Villano,M.,&Crowell,C.R(2012).Theclinicaluseofrobotsforindividualswithautismspectrumdisorders:Acriticalreview.ResearchinAutismSpectrumDisorders,6(1),249-262.

*Dickinson,A.,Daniel,M.,Marin,A.,Gaonkar,B.,Dapretto,M.,McDonald,N.M.,&Jeste,S(2020).Multivariateneuralconnectivitypatternsinearlyinfancypredictlaterautismsymptoms.BiologicalPsychiatry:CognitiveNeuroscienceandNeuroimaging,6(1),59-69.

*Dong,H.Y.,Chen,D.,Zhang,L.,Ke,H.J.,&Li,X.L(2021).SubjectsensitiveEEGdiscriminationwithfastreconstructableCNNdrivenbyreinforcementlearning:AcasestudyofASDevaluation.Neurocomputing,449,136-145.

DubreuilVall,L.,Ruffini,G.,&Camprodon,J.A(2020).DeeplearningconvolutionalneuralnetworksdiscriminateadultADHDfromhealthyindividualsonthebasisofeventrelatedspectralEEG.FrontiersinNeuroscience,14,251.

*Duda,M.,Daniels,J.,&Wall,D.P(2016).Clinicalevaluationofanovelandmobileautismriskassessment.JournalofAutismandDevelopmentalDisorders,46(6),1953-1961.

*Duda,M.,Haber,N.,Daniels,J.,&Wall,D.P(2017).CrowdsourcedvalidationofamachinelearningclassificationsystemforautismandADHD.TranslationalPsychiatry,7(5),e1133.

*Duda,M.,Ma,R.,Haber,N.,&Wall,D.P(2016).UseofmachinelearningforbehavioraldistinctionofautismandADHD.TranslationalPsychiatry,6(2),e732.