Datu zinātne vai mašīnmācība? Heres, kā pamanīt atšķirību

Saturs

Datu zinātne un mašīnmācība: plaša un šaura terminoloģija
Datu zinātnes un mašīnmācīšanās prasmju komplekti
Bez kļūdām, bez stresa - jūsu soli pa solim, kā izveidot programmatūru, kas maina dzīvi, neiznīcinot savu dzīvi
Kā noteikt mašīnu apguvi
Divas vismodernākās disciplīnas

Avots: Elnur / Dreamstime.com

Izņemšana:

Datu zinātne un mašīnmācība atšķiras dažādos veidos. Dažos veidos vienu var uzskatīt par otra apakškopu. Abas ir svarīgas pašreizējā IT progresā.

Šajā jaunajā mākslīgā intelekta un datu pārvaldības pasaulē ir viegli sajaukt dažus terminus, kurus IT pasaulē visbiežāk izmanto.

Piemēram, datu zinātnei un mašīnmācībai ir daudz savstarpējas saistības. Tas nav pārsteidzoši, ka daudziem cilvēkiem, kuriem ir tikai zināšanas šajās disciplīnās, būtu grūti saprast, kā viņi atšķiras viens no otra.

Šis ir labākais veids, kā nodalīt datu zinātni no mašīnmācīšanās kā principa un kā tehnoloģisko pieeju.

Datu zinātne un mašīnmācība: plaša un šaura terminoloģija

Pirmkārt, datu zinātne patiešām ir plaša, visaptveroša tehnoloģiju kategorija, kas ietver daudz dažādu projektu un darbu veidus. (Plašāku informāciju par datiem, kas iesaistīti datu zinātnes darbā, skat. Darba loma: datu zinātnieks.)

Datu zinātne būtībā ir prakse strādāt ar lielajiem datiem. Tā radās, ievērojot Mūra likumu, un efektīvāku datu glabāšanas ierīču izplatība ļāva uzņēmumiem un citām pusēm savākt milzīgu datu daudzumu. Pēc tam lielās datu platformas un rīki, piemēram, Hadoop, sāka pārveidot skaitļošanu, mainot to, kā darbojas datu pārvaldība. Tagad, izmantojot mākoni un konteinerizēšanu, kā arī pavisam jaunus modeļus, lieli dati ir kļuvuši par galveno virzītāju mūsu darba un dzīves veidiem.

Datu zinātne visvienkāršākajā formā ir veids, kā mēs pārvaldām šos datus, sākot no to tīrīšanas un pilnveidošanas līdz nodošanai izmantošanai ieskatu veidā.

Mašīnmācības definīcija ir daudz šaurāka. Mašīnmācībā tehnoloģijas ievāc datus un izmanto tos, izmantojot algoritmus, lai modelētu cilvēka kognitīvos procesus, kas aprakstīti kā “mācīšanās”. Citiem vārdiem sakot, ieņēmis datus un tos apmācot, dators spēj nodrošināt savus rezultātus. , kur tehnoloģija, šķiet, ir mācījusies no procesoriem, kurus ieviesuši programmētāji.

Datu zinātnes un mašīnmācīšanās prasmju komplekti

Vēl viens veids, kā pretstatīt datu zinātni un mašīnmācību, ir aplūkot dažādās prasmes, kas ir visvērtīgākās profesionāļiem kādā no šīm jomām.

Bez kļūdām, bez stresa - jūsu soli pa solim, kā izveidot programmatūru, kas maina dzīvi, neiznīcinot savu dzīvi

Jūs nevarat uzlabot savas programmēšanas prasmes, kad nevienam nerūp programmatūras kvalitāte.

Pastāv vispārēja vienprātība, ka datu zinātnieki gūst labumu no dziļām analītiskām un matemātiskām prasmēm, praktiskas pieredzes ar datu bāzu tehnoloģijām un zināšanām par programmēšanas valodām, piemēram, Python vai citām pakotnēm, kuras tiek izmantotas lielu datu parsēšanai.

“Ikvienam, kurš ir ieinteresēts veidot spēcīgu karjeru (datu zinātnē), vajadzētu iegūt pamatprasmes trīs departamentos: analītikā, programmēšanā un domēna zināšanās,” raksta Šrihari Sasikumārs Simplilearnā. “Dziļējoties par vienu līmeni dziļāk, šādas prasmes palīdzēs izkopt nišu kā datu zinātniekam: spēcīgas zināšanas par Python, SAS, R (un) Scala, praktiska pieredze SQL datu bāzes kodēšanā, spēja strādāt ar nestrukturētiem datiem no dažādi avoti, piemēram, video un sociālie mediji, saprot vairākas analītiskās funkcijas (un) zināšanas par mašīnmācīšanos. ”

Mašīnmācības jomā eksperti bieži min datu modelēšanas prasmes, zināšanas par varbūtību un statistiku, kā arī plašākas programmēšanas prasmes kā noderīgus rīkus mašīnmācīšanās inženiera rīku komplektā.

Kā noteikt mašīnu apguvi

Šeit galvenais ir tas, ka datu zinātnes darbu veido visa veida lietas, taču tā nav mašīnmācīšanās, ja vien jums nav izveidots ļoti stingrs režīms, kas palīdz datoram mācīties no tā ievadiem.

Kad tas ir izveidots, tas rada dažas pārsteidzoši spējīgas sistēmas, kurām var būt plaša ietekme uz mūsu dzīvi.

"Liela daļa no tā, ko mēs darām ar mašīnmācību, notiek zem zemes," ziņots, ka Amazon dibinātājs Džefs Bezoss sacīja, norādot uz dažiem šāda veida sistēmu pielietojumiem. “Mašīnmācība virza mūsu algoritmus pieprasījuma prognozēšanai, produktu meklēšanas ranžēšanai, produktu un darījumu ieteikumiem, izvietošanai tirgū, krāpšanas atklāšanai, tulkojumiem un vēl daudz kam citam. Lai arī tas ir mazāk pamanāms, liela daļa mašīnmācīšanās ietekmes būs šāda veida - mierīgi, bet ar jēgu uzlabojot pamatdarbības. ”

Viens no visnoderīgākajiem piemēriem šeit ir neironu tīkla parādīšanās - tā ir izplatīta un populāra metode mašīnmācīšanās procesu iestatīšanai.

Neironu tīkls visvienkāršākajā formā sastāv no mākslīgo neironu slāņiem. Katram atsevišķam mākslīgajam neironam ir tāda pati funkcionalitāte kā bioloģiskajam neironam - bet sinapses un dendrītu vietā tam ir ieejas, aktivizācijas funkcija un iespējamās izejas.

Neironu tīkls ir izveidots tā, lai darbotos kā cilvēka smadzenes, un mašīnmācības speciālisti bieži izmanto šo modeli, lai radītu mašīnmācīšanās rezultātus.

Tomēr tas nav vienīgais veids, kā apgūt mašīnu. Daži no rupjākiem mašīnmācīšanās projektiem vienkārši ietver plaša fotoattēlu klāsta parādīšanu datoram (vai tā piegādi ar citiem neapstrādātiem datiem), ideju ievadīšanu, izmantojot uzraudzītas mašīnmācības un etiķetes datus, un tā, lai dators beidzot spētu atšķirt dažādas formas vai priekšmeti redzes laukā. (Par mašīnmācības pamatiem skatiet Machine Learning 101.)

Divas vismodernākās disciplīnas

Noslēgumā jāsaka, ka mašīnmācīšanās ir vērtīga datu zinātnes sastāvdaļa. Bet datu zinātne atspoguļo robežu un robežu, kurā notiek mašīnmācība.

Savā ziņā jūs varētu teikt, ka mašīnmācība nekad nenotiks bez lieliem datiem. Lielie dati pati par sevi neradīja mašīnmācīšanos - tā vietā pēc tam, kad mēs bijām apkopojuši tik daudz datu, ka gandrīz nezinājām, ko ar to iesākt, augstākie prāti nāca klajā ar šiem bioimitējošajiem procesiem kā uzlādētu veidu. sniegt ieskatu.

Vēl viena laba lieta, kas šeit jāpatur prātā, ir tā, ka datu zinātni var izmantot divos galvenajos veidos - mēs varam atbalstīt mašīnmācīšanos un mākslīgo intelektu, ļaujot datoriem domāt par mums, vai arī mēs varam datu zinātni atgriezt uz vairāk uz cilvēku vērstu pieeju. dators vienkārši parāda rezultātus, un mēs kā cilvēki pieņemam lēmumus.

Tas liek dažiem ekspertiem, ieskaitot dažus no mūsdienu labākajiem novatoriem, aicināt uz aktīvāku grāmatvedību par veidiem, kā mēs izmantojam šīs tehnoloģijas.

"(AI) ir spējīgs sasniegt daudz vairāk nekā gandrīz ikviens zina, un uzlabojumu līmenis ir eksponenciāls," citēts Elons Musks, vienlaikus brīdinot, ka mašīnmācībai un AI programmām ir nepieciešama uzraudzība.

Jebkurā gadījumā gan datu zinātne, gan mašīnmācība ir galvenā daļa no progresa, ko šodien kā sabiedrības mēs gūstam tehnoloģiju jomā.