27-01-2016

Microsoft stelt deep learning toolkit CNTK als OS beschikbaar op GitHub

Deel dit bericht

De Computational Network Toolkit is door onderzoekers van Microsoft ontwikkeld om sneller resultaten te krijgen op het gebied van kunstmatige intelligentie. Microsoft stelt deze toolkit nu via een open source licentie voor ontwikkelaars breed beschikbaar op GitHub.

De Computational Network Toolkit, CNTK, is uit noodzaak ontwikkeld. In Microsoft's eigen onderzoek naar spraakherkenning bleven resultaten uit omdat de gebruikte software te traag was. Een groep ontwikkelaars binnen het team is aan een eigen oplossing begonnen, waarbij top performance het belangrijkste criterium was.
Microsoft wetenschapper en hoofd van het spraakherkenningsproject Xuedong Huang stelt dat CNTK 'insanely' efficiënter is dan vier andere toolkits, die ontwikkelaars gebruiken om deep learning modellen te bouwen voor spraak- en beeldherkenning.

In het zich snel ontwikkelende onderzoeksveld van 'deep learning' is performancewinst van onschatbare waarde omdat sommige projecten weken duren. Sinds enkele jaren houden steeds meer onderzoekers zich bezig met machine learning algoritmes, waarbij diepe neurale netwerken ingezet worden die gebaseerd zijn op de biologische processen van het menselijk brein. Veel onderzoekers verwachten met de inzet van deep learning veel resultaten voor het onderzoek naar kunstmatige intelligentie.

Microsoft gebruikt CNTK op de GPU van krachtige computers. Normaliter wordt de Graphics Processing Unit gebruikt voor beeldberekening en -verwerking, maar de onderzoekers hebben ontdekt dat de GPU ook ideaal is voor verwerking van algoritmes die spraakherkenning ondersteunen. CNTK is schaalbaar en kan zowel binnen een beperkt budget op een single core draaien, als ingezet worden op een groot cluster van GPU-gebaseerde computers, waardoor grootschalige experimenten mogelijk worden.

Huang wil dat CNTK, via een MIT open source licentie, beschikbaar is voor iedereen die onderzoek doet op het gebied van deep learning: van deep learning startups tot grote bedrijven die enorme hoeveelheden data in realtime verwerken. Huang hoopt dat hierdoor een doorbraak ontstaat in het onderzoek naar kunstmatige intelligentie.

Vorig jaar november heeft Microsoft al de Distributed Machine Learning Toolkit (DMTK) beschikbaar gesteld, die de analyse van grote hoeveelheden data mogelijk maakt.

Kijk voor CNTK op GitHub: www.github.com/Microsoft/CNTK
Kijk voor DMTK op GitHub: www.github.com/Microsoft/multiverso

Partners