Automatisering: fremtiden for datavitenskap og maskinlæring?

Maskinlæring har vært en av de største fremskrittene i databehandlingshistorien og blir nå sett på som å kunne spille en viktig rolle innen big data og analyse. Big data -analyse er en stor utfordring fra et virksomhetsperspektiv. For eksempel kan aktiviteter som å forstå det store antallet forskjellige dataformater, analysere dataforberedelse og filtrere overflødige data være ressurskrevende. Å rekruttere spesialister på dataforskere er et dyrt forslag og ikke et middel for et mål for hvert selskap. Eksperter tror at maskinlæring kan automatisere mange av oppgavene knyttet til analyse - både rutine og komplekse. Automatisert maskinlæring kan frigjøre betydelige ressurser som kan brukes til mer komplekst og innovativt arbeid. Maskinlæring ser ut til å bevege seg i denne retningen hele tiden.

Automatisering i forbindelse med informasjonsteknologi

I IT er automatisering tilkoblingen av forskjellige systemer og programvare, slik at de kan utføre spesifikke oppgaver uten menneskelig inngrep. I IT kan automatiserte systemer utføre både enkle og komplekse jobber. Et eksempel på en enkel jobb kan være å integrere skjemaer med PDF-filer og sende dokumenter til riktig mottaker, mens sikkerhetskopiering utenfor stedet kan være et eksempel på en kompleks jobb.

For å gjøre jobben din riktig, må du programmere eller gi klare instruksjoner til det automatiserte systemet. Hver gang et automatisert system er nødvendig for å endre omfanget av jobben, må programmet eller instruksjonssettet oppdateres av noen. Selv om det automatiserte systemet er effektivt i jobben, kan det oppstå feil av forskjellige årsaker. Når det oppstår feil, må grunnårsaken identifiseres og korrigeres. For å gjøre jobben sin er et automatisert system helt avhengig av mennesker. Jo mer kompleks arbeidets art er, desto større er sannsynligheten for feil og problemer.

Et vanlig eksempel på automatisering i IT-bransjen er automatisering av testing av nettbaserte brukergrensesnitt. Testtilfeller mates inn i automatiseringsskriptet og brukergrensesnittet testes deretter. (For mer om den praktiske anvendelsen av maskinlæring, se Machine Learning og Hadoop i Next Generation Fraud Detection.)

Argumentet til fordel for automatisering er at det utfører rutinemessige og repeterbare oppgaver og frigjør ansatte til å utføre mer komplekse og kreative oppgaver. Imidlertid hevdes det også at automatisering har utelukket et stort antall oppgaver eller roller som tidligere er utført av mennesker. Nå, med maskinlæring som går inn i ulike bransjer, kan automatisering legge til en ny dimensjon.

Fremtiden for automatisert maskinlæring?

Essensen i maskinlæring er systemets evne til kontinuerlig å lære av data og utvikle seg uten menneskelig inngrep. Maskinlæring er i stand til å fungere som en menneskelig hjerne. For eksempel kan anbefalingsmotorer på e-handelsnettsteder vurdere en brukers unike preferanser og smaker og gi anbefalinger om de mest passende produktene og tjenestene å velge mellom. Gitt denne evnen, blir maskinlæring sett på som ideell for automatisering av komplekse oppgaver knyttet til store data og analyse. Den har overvunnet de store begrensningene ved tradisjonelle automatiserte systemer som ikke tillater menneskelig inngrep regelmessig. Det er flere casestudier som viser maskinlærings evne til å utføre komplekse dataanalyseoppgaver, som vil bli diskutert senere i denne artikkelen.

Som allerede nevnt er big data -analyse et utfordrende forslag for bedrifter, som delvis kan delegeres til maskinlæringssystemer. Fra et forretningsperspektiv kan dette gi mange fordeler, som å frigjøre datavitenskapelige ressurser for mer kreative og misjonskritiske oppgaver, høyere arbeidsmengde, mindre tid til å fullføre oppgaver og kostnadseffektivitet.

Casestudie

I 2015 begynte MIT -forskere å jobbe med et datavitenskapelig verktøy som kan lage prediktive datamodeller fra store mengder rådata ved hjelp av en teknikk som kalles dypfunksjonssyntesealgoritmer. Forskerne hevder at algoritmen kan kombinere de beste funksjonene i maskinlæring. Ifølge forskerne har de testet det på tre forskjellige datasett og utvider testingen til å omfatte flere. I et papir som skal presenteres på den internasjonale konferansen om datavitenskap og analyse, sa forskerne James Max Kanter og Kalyan Veeramachaneni: "Ved å bruke en automatisk tuningprosess optimaliserer vi hele banen uten menneskelig involvering, slik at den kan generalisere til forskjellige datasett".

La oss se på oppgavens kompleksitet: Algoritmen har det som er kjent som en autojusteringsfunksjon, ved hjelp av hvilken innsikt eller verdier som kan hentes eller hentes ut av rådata (for eksempel alder eller kjønn), hvoretter prediktive data modeller kan lages. Algoritmen bruker komplekse matematiske funksjoner og en sannsynlighetsteori kalt Gaussian Copula. Det er derfor lett å forstå kompleksitetsnivået som algoritmen kan håndtere. Denne teknikken har også vunnet premier i konkurranser.

Maskinlæring kan erstatte lekser

Det diskuteres rundt om i verden at maskinlæring kan erstatte mange jobber fordi den utfører oppgaver med effektiviteten til den menneskelige hjernen. Faktisk er det en viss bekymring for at maskinlæring vil erstatte datavitenskapere, og det ser ut til å være et grunnlag for en slik bekymring.

For den gjennomsnittlige brukeren som ikke har dataanalyseferdigheter, men har varierende grad av analytiske behov i sitt daglige liv, er det ikke mulig å bruke datamaskiner som kan analysere enorme datamengder og levere analysedata. Imidlertid kan Natural Language Processing (NLP) teknikker overvinne denne begrensningen ved å lære datamaskiner å akseptere og behandle naturlig menneskelig språk. På denne måten trenger ikke den gjennomsnittlige brukeren sofistikerte analytiske funksjoner eller ferdigheter.

IBM mener at behovet for dataforskere kan minimeres eller elimineres gjennom produktet, Watson Natural Language Analytics Platform. Ifølge Marc Atschuller, visepresident for analyse og business intelligence i Watson, "Med et kognitivt system som Watson, stiller du bare spørsmålet ditt - eller hvis du ikke har et spørsmål, laster du bare opp dataene dine og Watson kan se på det og slutte hva du kanskje vil vite. ”

Konklusjon

Automatisering er det neste logiske trinnet i maskinlæring, og vi opplever allerede effektene i hverdagen vår-e-handelsnettsteder, forslag til Facebook-venner, forslag til LinkedIn-nettverk og Airbnb-rangeringer. Tatt i betraktning de gitte eksemplene, er det ingen tvil om at dette kan tilskrives kvaliteten på produksjonen produsert av automatiserte maskinlæringssystemer. I alle kvaliteter og fordeler virker tanken på maskinlæring som forårsaker enorm arbeidsledighet litt av en overreaksjon. Maskiner har erstattet mennesker i mange deler av våre liv i flere tiår, men mennesker har utviklet seg og tilpasset seg for å forbli relevante i bransjen. Ifølge synet er maskinlæring for all dens forstyrrelse bare en annen bølge som folk vil tilpasse seg.


Innleggstid: 03-03-2021