Outomatisering: die toekoms van datawetenskap en masjienleer?

Masjienleer was een van die grootste vooruitgang in die geskiedenis van rekenaars en word nou beskou as 'n belangrike rol op die gebied van groot data en analise. Groot data -analise is 'n groot uitdaging vanuit 'n onderneming se perspektief. Byvoorbeeld, aktiwiteite soos die begrip van die groot aantal verskillende dataformate, die ontleding van data -voorbereiding en die filter van oortollige data kan hulpbronintensief wees. Die werwing van spesialiste in data -wetenskaplikes is 'n duur voorstel en nie 'n middel vir elke onderneming nie. Kenners meen dat masjienleer baie van die take wat met analise verband hou, outomaties kan outomatiseer - beide roetine en kompleks. Outomatiese masjienleer kan aansienlike hulpbronne bevry wat gebruik kan word vir meer komplekse en innoverende werk. Dit lyk asof masjienleer die hele tyd in hierdie rigting beweeg.

Outomatisering in die konteks van inligtingstegnologie

In IT is outomatisering die verbinding van verskillende stelsels en sagteware, wat hulle in staat stel om spesifieke take uit te voer sonder enige menslike ingryping. In IT kan outomatiese stelsels eenvoudige sowel as komplekse take verrig. 'N Voorbeeld van 'n eenvoudige taak kan wees om die vorms met PDF's te integreer en dokumente na die regte ontvanger te stuur, terwyl rugsteun van buite die werf 'n voorbeeld kan wees van 'n ingewikkelde taak.

Om u werk behoorlik te verrig, moet u die outomatiese stelsel programmeer of duidelike instruksies gee. Elke keer dat 'n outomatiese stelsel nodig is om die omvang van sy werk te verander, moet die program of instruksieset deur iemand opgedateer word. Alhoewel die outomatiese stelsel doeltreffend werk, kan daar om verskeie redes foute voorkom. As foute voorkom, moet die oorsaak geïdentifiseer en reggestel word. Dit is duidelik dat 'n outomatiese stelsel heeltemal afhanklik is van mense om sy werk te doen. Hoe meer kompleks die aard van die werk is, hoe groter is die waarskynlikheid van foute en probleme.

'N Algemene voorbeeld van outomatisering in die IT-industrie is die outomatisering van die toets van webgebaseerde gebruikerskoppelvlakke. Toetsgevalle word in die outomatiseringsskrif ingevoer en die gebruikerskoppelvlak word daarvolgens getoets. (Vir meer inligting oor die praktiese toepassing van masjienleer, sien Masjienleer en Hadoop in die opsporing van bedrog in die volgende generasie.)

Die argument ten gunste van outomatisering is dat dit roetine en herhaalbare take verrig en werknemers vrystel om meer komplekse en kreatiewe take uit te voer. Daar word egter ook aangevoer dat outomatisering 'n groot aantal take of rolle uitgesluit het wat voorheen deur mense uitgevoer is. Met die aanleer van masjienleer in verskillende bedrywe, kan outomatisering 'n nuwe dimensie toevoeg.

Die toekoms van outomatiese masjienleer?

Die essensie van masjienleer is die vermoë van 'n stelsel om voortdurend uit data te leer en sonder menslike ingryping te ontwikkel. Masjienleer kan optree soos 'n menslike brein. Aanbevelingsenjins op e-handelswebwerwe kan byvoorbeeld 'n gebruiker se unieke voorkeure en smaak beoordeel en aanbevelings gee oor die mees geskikte produkte en dienste om van te kies. Gegewe hierdie vermoë, word masjienleer beskou as ideaal vir die outomatisering van komplekse take wat verband hou met groot data en analise. Dit het die groot beperkings van tradisionele outomatiese stelsels oorkom wat nie gereeld menslike ingryping moontlik maak nie. Daar is verskeie gevallestudies wat die vermoë van masjienleer demonstreer om komplekse data -analise -take uit te voer, wat later in hierdie artikel bespreek sal word.

Soos reeds opgemerk, is groot data -analise 'n uitdagende voorstel vir ondernemings, wat gedeeltelik na masjienleerstelsels gedelegeer kan word. Vanuit 'n sakeperspektief kan dit baie voordele inhou, soos die vrystelling van data -wetenskaplike hulpbronne vir meer kreatiewe en kritiese take, hoër werklading, minder tyd om take te voltooi en koste -effektiwiteit.

Gevallestudie

In 2015 het MIT -navorsers begin werk aan 'n data -wetenskaplike hulpmiddel wat voorspellende datamodelle kan skep uit groot hoeveelhede rou data met behulp van 'n tegniek wat sintese -algoritmes vir diepgaande funksies genoem word. Die wetenskaplikes beweer dat die algoritme die beste kenmerke van masjienleer kan kombineer. Volgens die wetenskaplikes het hulle dit op drie verskillende datastelle getoets en brei dit uit om meer te bevat. In 'n referaat wat tydens die Internasionale Konferensie oor Gegewenswetenskap en Analytics voorgelê word, het navorsers James Max Kanter en Kalyan Veeramachaneni gesê: "Deur 'n outomatiese afstemproses te optimaliseer, optimaliseer ons die hele pad sonder menslike betrokkenheid, sodat dit kan generaliseer na verskillende datastelle".

Kom ons kyk na die kompleksiteit van die taak: die algoritme het 'n outomatiese aanpassingsvermoë, waarmee insigte of waardes verkry kan word of onttrek kan word uit rou data (soos ouderdom of geslag), waarna voorspellende data modelle geskep kan word. Die algoritme gebruik komplekse wiskundige funksies en 'n waarskynlikheidsteorie genaamd Gaussian Copula. Dit is dus maklik om die kompleksiteit wat die algoritme kan hanteer, te verstaan. Hierdie tegniek het ook pryse in kompetisies gewen.

Masjienleer kan huiswerk vervang

Daar word wêreldwyd bespreek dat masjienleer baie werk kan vervang omdat dit take met die doeltreffendheid van die menslike brein verrig. Daar is eintlik 'n mate van kommer dat masjienleer data -wetenskaplikes sal vervang, en dit lyk asof daar 'n basis is vir hierdie kommer.

Vir die gemiddelde gebruiker wat nie oor data -analise -vaardighede beskik nie, maar met verskillende grade van analitiese behoeftes in hul daaglikse lewens, is dit nie haalbaar om rekenaars te gebruik wat groot hoeveelhede data kan ontleed en ontledingsdata kan verskaf nie. Natuurlike taalverwerking (NLP) tegnieke kan hierdie beperking egter oorkom deur rekenaars te leer om natuurlike menslike taal te aanvaar en te verwerk. Op hierdie manier benodig die gemiddelde gebruiker nie gesofistikeerde analitiese funksies of vaardighede nie.

IBM glo dat die behoefte aan data -wetenskaplikes tot die minimum beperk of uitgeskakel kan word deur middel van sy produk, die Watson Natural Language Analytics Platform. Volgens Marc Atschuller, vise -president van analise en sake -intelligensie by Watson, 'met 'n kognitiewe stelsel soos Watson, stel jy net jou vraag - of as jy nie 'n vraag het nie, laai jy net jou data op en Watson kan daarna kyk en aflei wat u dalk wil weet. ”

Afsluiting

Outomatisering is die volgende logiese stap in masjienleer en ons ondervind reeds die gevolge in ons daaglikse lewens-e-handelswebwerwe, Facebook-vriendvoorstelle, LinkedIn-netwerkvoorstelle en Airbnb-soekranglys. Gegewe die voorbeelde, is daar geen twyfel dat dit toegeskryf kan word aan die kwaliteit van die uitset wat deur outomatiese masjienleerstelsels geproduseer word nie. Al sy eienskappe en voordele lyk die idee van masjienleer wat groot werkloosheid veroorsaak, 'n bietjie van 'n oorreaksie. Masjiene het mense in baie dele van ons lewens al dekades lank vervang, maar mense het ontwikkel en aangepas om relevant te bly in die bedryf. Volgens die siening is masjienleer vir al sy ontwrigting net nog 'n golf waarby mense sal aanpas.


Plaas tyd: Aug-03-2021