Apa itu Pembelajaran Mesin? Glosarium Kecerdasan Bisnis Esensial Anda

Diterbitkan: 2022-05-07

Saya selalu melihat pembersihan musim semi terlalu sedikit, terlalu terlambat. Bagi saya, Januari adalah saat Anda memesan, memprioritaskan, dan mulai menjawab pertanyaan tahun depan. Itu sebabnya saya memilih Januari untuk menjawab pertanyaan yang mungkin Anda miliki beberapa saat: apa itu pembelajaran mesin?

Saya akan menjawabnya, dan juga mendefinisikan beberapa istilah lain yang perlu Anda ketahui agar tetap berada di puncak 2017. Jika Anda tertarik dengan apa yang dapat dilakukan perangkat lunak intelijen bisnis untuk Anda, Anda harus mengetahui istilah dasar ini terlebih dahulu .

Saya telah mengutamakan pembelajaran mesin, karena ini adalah salah satu dari Sepuluh Tren Teknologi Strategis Teratas Gartner untuk tahun 2017 , tetapi entri lainnya disusun menurut abjad.

Pembelajaran mesin

Sebelum pembelajaran mesin, komputer harus diberi tahu (diprogram) cara berpikir. Dengan pembelajaran mesin, komputer dapat berpikir (semacam) untuk diri mereka sendiri.

Saya baru-baru ini berbicara dengan Michael Finley, Kepala Pembelajaran Mesin di perusahaan perangkat lunak BI AnswerRocket , yang membantu menguraikan. Sebelum pembelajaran mesin, sebagian besar perangkat lunak "berjalan seperti yang diprogram: orang mengubah instruksi menjadi kode komputer, dan komputer melakukan apa yang diperintahkan kode itu." Contoh yang sangat sederhana adalah kalkulator: Anda memasukkan nomor kalkulator, memberi tahu apa yang harus dilakukan (menambah, mengurangi), dan kalkulator memberi Anda hasil. Namun, dengan pembelajaran mesin, perangkat lunak dapat beradaptasi. Finley melanjutkan: “Perangkat lunak dengan pembelajaran mesin tidak melakukan hal yang sama pada hari Anda menginstalnya seperti pada hari kesepuluh atau keseratus Anda menjalankannya.” Jika nilai yang dimasukkan ke dalam komputer berubah, perangkat lunak akan beradaptasi dengan nilai tersebut. Komputer dengan pembelajaran mesin mempelajari cara menggabungkannya.

Atas perkenan Andre Pinto dan Anthill Comics yang mengagumkan

Finley mencirikan pembelajaran mesin sebagai perangkat lunak yang tahu bagaimana menangani konsep "suka", seperti, "Saya ingin mendengar lagu seperti yang terakhir saya dengar." Konsepnya mudah bagi orang-orang, tetapi sulit bagi komputer. Finley menjelaskan bahwa komputer pandai memahami angka mana yang lebih besar atau lebih kecil, dan dalam mencocokkan angka dan nama, tetapi mereka berjuang dengan gagasan kesamaan. Pembelajaran mesin membantu komputer memahami mengapa satu hal "seperti" yang lain. Pemahaman tentang kesamaan pembelajaran mesin sangat membantu dalam memprediksi keinginan pelanggan.

Pembelajaran mesin ada di balik lagu berikutnya yang Anda dengar di Pandora, atau film yang disarankan Netflix. Algoritme pembelajaran mesin Pandora dan Netflix "diberi" pilihan Anda (dan "suka" yang sebenarnya, dalam kasus Pandora), dan menggunakannya untuk memprediksi lagu atau acara serupa yang mungkin Anda sukai.

Beri makan algoritme pembelajaran mesin itu dengan data yang berbeda, dan mereka akan bereaksi secara berbeda. Jika diet film horor Anda yang biasa tiba-tiba dan entah kenapa termasuk komedi romantis, algoritme ML Netflix akan bereaksi terhadap data itu, dan mulai menyarankan komedi romantis lainnya, atau roman horor.

Selain selera film yang menurun, mengapa pembelajaran mesin penting bagi UKM? Ini dapat membantu mereka bersaing dengan pesaing yang lebih besar. Perangkat lunak BI dengan pembelajaran mesin mengambil angka baru setiap kali Anda menyegarkan. Anda tidak mendasarkan strategi pada angka laporan tahunan, Anda mendasarkannya pada informasi yang hampir real-time, dan algoritme yang tahu cara beradaptasi dengan data yang berubah itu. Finley menjelaskan bahwa cara tradisional dan homogen dari skala bisnis apa pun yang mereka lakukan dapat direvolusi dengan ML:

“Saya mungkin telah menyusun praktik terbaik dan ingin mengulangi proses. Tetapi bagaimana jika Anda dapat menyusun praktik terbaik setiap hari, jika Anda memiliki info untuk mengubahnya dan merumuskan ulang strategi Anda setiap hari? Anda memiliki data berkat ML yang dapat menulis ulang strategi setiap hari, dan begitulah cara SMB benar-benar memakan makan siang dari orang-orang yang lebih besar.”

Untuk UKM yang tertarik dengan strategi bisnis yang gesit, pembelajaran mesin mungkin lebih dari sekadar cara untuk tetap hidup. Ini bisa menjadi cara untuk mulai mengambil bagian dari pangsa pasar pemain mapan.

  • Analisis ad hoc
  • Permintaan ad hoc
  • Analisis Lanjutan
  • Kecerdasan buatan
  • Data besar
  • Data Kontekstual
  • Titik Data
  • Kualitas data
  • Visualisasi data
  • Gudang data
  • Basis Data
  • Dasbor
  • Perincian
  • ETL
  • Metadata
  • Metrik
  • BI modern
  • BI tradisional
  • Perangkat Lunak SaaS/Cloud
  • Iris-dan-dadu
  • SQL
  • Istilah yang ingin Anda ketahui…

Analisis ad hoc

Analitik ad hoc adalah analisis saat Anda membutuhkannya, pada tingkat yang dapat dipahami oleh non-IT, non-spesialis.

Jika intelijen bisnis yang dapat diakses tampak seperti hal yang diinginkan, itu tidak selalu dapat dicapai. Untuk waktu yang lama, profesional BI harus mampu "berbicara komputer" (yaitu, menulis dalam bahasa pengkodean) untuk menanyakan program intelijen bisnis. Tidak tahu cara membuat kode dalam SQL, R atau Python? Tanyakan seseorang di IT yang melakukannya. Kemudian tunggu. Dan kemudian menunggu program intelijen bisnis untuk bekerja, dan kemudian menunggu lagi untuk analisis.

Untungnya, BI akhirnya matang untuk analitik ad hoc. : Dengan sistem ini, Anda tidak perlu menunggu TI, atau kecepatan pembuatan laporan tradisional yang lebih lambat, untuk mendapatkan data yang Anda perlukan. Itu membuat pekerjaan Anda, dan pekerjaan mereka, lebih mudah dan tidak membuat stres.

Jika Anda tidak memiliki staf TI, analitik ad hoc memecahkan masalah itu. Analitik ad hoc juga menciptakan waktu-untuk-wawasan yang lebih cepat (ini adalah kata kunci lain yang mungkin Anda lihat; itu berarti dibutuhkan waktu yang lebih singkat untuk mendapatkan info yang Anda butuhkan).

Permintaan ad hoc

"Permintaan" adalah pertanyaan yang mungkin Anda minta untuk dijawab oleh perangkat lunak intelijen bisnis Anda. Misalnya, Anda mungkin meminta perangkat lunak BI Anda untuk daftar abjad dari semua pelanggan bermata cokelat yang lahir sejak tahun 1970. Anda dapat dengan mudah menyebut kueri sebagai pertanyaan, tetapi seberapa sering Anda mengucapkan "permintaan" dalam percakapan?

Kueri ad hoc adalah kueri yang dapat Anda minta saat Anda membutuhkannya. Seperti halnya analitik bisnis yang lebih lama, kueri yang lebih lama membutuhkan seseorang di TI untuk menanyakannya. Kueri juga cenderung dilakukan sebagai bagian dari laporan rutin yang Anda dapatkan setiap bulan atau setiap tahun. Dengan perangkat lunak BI yang lebih lama, Anda harus menanyakan kueri itu dalam bahasa pemrograman. SQL adalah salah satu standar lama dalam intelijen bisnis; hari ini, R dan Python adalah yang populer.

Anda bisa melihat program komputer, termasuk BI, sebagai cabang birokrasi, dari DOJ hingga HHS. Mereka secara teknis ada untuk menyelesaikan sesuatu, tetapi masing-masing memiliki bahasanya sendiri, dan bekerja dengan caranya sendiri. Seorang programmer seperti seorang birokrat yang berbicara bahasa dan tahu bagaimana menavigasi setiap program/departemen.

Analisis Lanjutan

Istilah ini sebenarnya melampaui intelijen bisnis. "Bisnis intelijen" secara tradisional berurusan dengan menganalisis apa yang terjadi. Analisis lanjutan melangkah lebih jauh, apakah itu memperkirakan apa yang akan terjadi di masa depan, atau menganalisis detail dan faktor yang biasanya tidak terkait dengan kecerdasan bisnis. Beberapa contoh analitik tingkat lanjut adalah penambangan data dan teks , analitik prediktif , perkiraan , analitik lokasi , analisis sentimen , dan pembelajaran mesin.

Kecerdasan buatan

Pembelajaran mesin adalah salah satu bagian dari AI, tetapi AI adalah konsep yang jauh lebih besar. AI mencakup apa pun yang Anda sebut " kecerdasan yang ditunjukkan oleh mesin ." "Kecerdasan," dalam arti AI, berarti kemampuan untuk menyelesaikan sesuatu. Jadi, pemahaman umum tentang "kecerdasan" sebagai hanya mengetahui banyak bukanlah jenis kecerdasan yang ditemukan di AI.

“Sesuatu” yang bisa dilakukan AI sudah bervariasi. Misalnya, Daisy Intelligence menggunakan AI untuk memeriksa data pengecer, lalu membuat rekomendasi yang mereka klaim dapat “meningkatkan penjualan sebesar 5% atau lebih.” Jika, seperti saya, Anda menikmati penjadwalan seperti halnya menunggu di DMV, asisten virtual seperti Amy , yang dapat menjadwalkan rapat berdasarkan preferensi peserta, bisa menjadi teman imajiner terbaik Anda.

Data besar

Data besar adalah kumpulan data yang sangat besar. Meskipun saya biasanya setuju dengan Stephen King bahwa " jalan menuju neraka diaspal dengan kata keterangan ," bahwa "sangat" dijamin. Sejumlah kecil data akan menjadi, katakanlah, sebuah buku pendek. PDF buku Harry Potter pertama berukuran sekitar satu megabyte (MB).

Big Data akan menjadi sesuatu seperti satu petabyte data. Untuk melanjutkan contoh buku, semua yang tertulis, sejak awal sejarah yang tercatat, adalah 50 petabyte . Perusahaan besar, seperti Google, adalah jenis yang berurusan dengan petabyte. Sistem Mesa Google , yang memantau lalu lintas iklan Google, melacak data berukuran petabyte.

Data kontekstual

Data kontekstual adalah data tambahan tentang seseorang, tempat, atau peristiwa (yang disebut "entitas" dalam bahasa data). Data kontekstual membantu melengkapi apa yang diketahui bisnis tentang pelanggan potensial, dan bahkan memprediksi apa yang mungkin mereka inginkan.

Meskipun ini bukan bisnis, University of Manchester di Inggris menggunakan data kontekstual dalam proses penerimaannya untuk “ membangun pandangan yang utuh dan menyeluruh tentang pencapaian dan potensi Anda .” Bersamaan dengan formulir penerimaan siswa, UM mempertimbangkan faktor-faktor seperti kode pos kandidat, kualitas sekolah tempat Anda mengikuti ujian, dan “ apakah Anda telah dirawat atau dirawat selama lebih dari tiga bulan.”

Untuk bisnis, data kontekstual mungkin membantu penjualan. Sebagai contoh yang sangat luas, data kontekstual tentang pelanggan lama, berdasarkan cuaca di lokasi mereka, dapat mendorong pendapatan. Seorang pelanggan di Tuscon, Arizona lebih cenderung membeli es loli pada bulan Oktober daripada di International Falls, Minnesota .

Titik Data

Titik data adalah potongan data tunggal. Titik data adalah unit mandiri, atau datum, di antara data yang Anda lacak. Satu titik data dapat berupa apa saja mulai dari “ ukuran investasi ” hingga satu klik pada iklan yang Anda beli di Google. Dalam kasus Uber, lokasi adalah titik data penting—yang sangat penting sehingga mereka benar-benar melacaknya setelah perjalanan Anda selesai .

Jika Anda terbiasa dengan indikator kinerja utama , Anda sudah familiar dengan poin data. KPI mengukur jenis titik data tertentu, seperti pendapatan atau waktu yang diperlukan untuk menyelesaikan proyek.

Kualitas data

Kualitas data adalah ukuran kegunaan data Anda. Data berkualitas tinggi bersih, terorganisir, dan tersedia. Jika data perpustakaan adalah buku-bukunya, perpustakaan dengan data berkualitas tinggi akan memiliki buku-buku yang diinginkan dan dibutuhkan penduduk, dalam kondisi baik, dan disimpan di tempat yang tepat.

Ada enam dimensi kualitas data:

  • Kelengkapan
  • Keunikan
  • Keabsahan
  • Ketepatan waktu
  • Konsistensi
  • Ketepatan

Visualisasi data

Visualisasi data adalah gambar, visual, atau grafik apa pun yang menampilkan data Anda. Diagram lingkaran dan diagram batang adalah jenis yang paling umum. Ada rentang visualisasi yang jauh lebih luas di luar sana. Kriteria Evaluasi Gartner untuk Platform Intelijen Bisnis dan Analisis untuk 2016 (dilindungi paywall; sepadan) menilai jenis bagan yang lebih canggih sebagai item "pilihan" yang harus dicari dalam solusi BI Anda. Beberapa dari kualitas yang lebih tinggi, jenis grafik pilihan yang harus dicari adalah:

  • Bagan Marimekko
  • Grafik X/Y
  • Bagan Jaringan
  • Diagram Pareto
  • Awan Kata

Gudang data

Gudang data adalah sistem komputer tempat data dari berbagai basis data dan sistem transaksional disimpan dan diatur. Anda akan sering melihat istilah dengan "perusahaan" di bagian depan, karena Anda akan memerlukan sejumlah besar data berukuran perusahaan untuk memerlukan gudang data.

Basis Data

Basis data adalah data, terorganisir sehingga Anda bisa mendapatkan apa yang Anda butuhkan dengan mudah. Pernah ke IMDB ? Tentu saja Anda punya. Itu database: film, aktor, sutradara, produser, semua diatur untuk pencarian mudah, seperti ketika Anda perlu curang dalam permainan enam derajat Kevin Bacon .

Dasbor

Gambar itu sebelum penjelasan ini karena lebih mudah untuk menunjukkan seperti apa tampilan dasbor.

Untuk definisi formal: dasbor adalah representasi visual dari data yang Anda lacak. Program BI Anda mutlak harus memiliki dasbor. Anda tidak akan membeli mobil tanpa dashboard. Hal yang sama berlaku untuk perangkat lunak BI.

Saat Anda berbelanja perangkat lunak BI, pastikan dasbor program Anda memiliki dua kriteria dasar berikut yang direkomendasikan oleh Gartner (dilindungi paywall; sepadan):

  • “Kemampuan untuk mendesain dasbor dengan, minimal, tipe bagan dasar termasuk tabel, bagan batang, bagan garis, bagan area, dan bagan pai tanpa memerlukan opsi, pengkodean, atau skrip pihak ketiga.”
  • “Apa yang Anda lihat adalah apa yang Anda dapatkan (WYSIWYG) desain,” kemampuan untuk merancang dasbor dan menganalisis data tanpa mengetahui cara membuat kode.

Perincian

Menelusuri mengacu pada kemampuan untuk mengambil informasi umum, seperti angka penjualan tahunan, dan menelusuri berdasarkan bulan, minggu, atau bahkan hari. “Metelusuri” berarti Anda dapat mempersempit dari yang umum ke hal-hal khusus yang sering membuat perbedaan antara informasi dan wawasan. Telusuri seperti versi intelijen bisnis dari film "kekuatan sepuluh" yang lama.

ETL

ETL—atau ekstrak, transformasi, muat—terjadi antara pengumpulan data dan penempatan data tersebut di gudang data.

Kebutuhan untuk "mengekstrak" berasal dari fakta bahwa data dikumpulkan dalam database atau perangkat lunak ERP sebelum sampai ke gudang data. Kebutuhan untuk mentransformasi berasal dari fakta bahwa berbagai sumber data tersebut seringkali dalam format yang berbeda, dan perlu diubah ke dalam format yang tepat untuk disimpan dan dicari di gudang data. Kebutuhan untuk memuat cukup jelas; Anda harus memasukkannya ke dalam gudang data sebelum Anda dapat mencari dan membandingkan satu sumber data dengan yang lain.

Metadata

Metadata adalah data tentang data. Jika itu terdengar, meta, itu adalah ... itu meta data !

Tapi serius.

Metadata adalah informasi tentang data Anda. Ada tiga kategori:

  • Teknis: detail teknis tentang data Anda, seperti model, format, dan ukurannya.
  • Bisnis: deskripsi data dalam istilah yang mudah digunakan (yaitu, bahasa Inggris biasa)
  • Proses: data yang memberi tahu Anda apa yang dilakukan dengan potongan data mana, dan kapan.

Metrik

"Metrik" hanyalah kata yang bagus untuk hal apa pun yang Anda ukur.

Apakah Anda melacak laba bersih Anda? Itu metrik. Mengawasi berapa banyak orang yang menggunakan perangkat lunak BI di perusahaan Anda? Itu juga metrik. Mengawasi tingkat percakapan itu? Itu juga metrik. Trik dengan metrik adalah memilih yang terbaik untuk perusahaan Anda. Setiap perusahaan memiliki kebutuhan yang berbeda, dan sebaiknya pertimbangkan kebutuhan dan prioritas Anda saat memilih metrik .

BI modern

Istilah intelijen bisnis modern berasal dari Gartner , yang mendefinisikannya sebagai berikut :

Platform BI modern mendukung pengembangan konten analitik yang mendukung TI. Ini ditentukan oleh arsitektur mandiri yang memungkinkan pengguna nonteknis untuk secara mandiri menjalankan alur kerja analitik spektrum penuh dari akses data, penyerapan dan persiapan hingga analisis interaktif dan berbagi wawasan secara kolaboratif.

Sederhananya, BI modern mengutamakan pengguna bisnis. Anda tidak perlu bergantung pada seseorang dari TI, atau Anda tidak perlu terlalu bergantung pada mereka, untuk menggunakan program BI modern. Di mana program BI lama dan tradisional disiapkan untuk hanya mengizinkan orang-orang TI untuk membuat konten, misalnya, program BI modern memudahkan pengguna bisnis untuk membuat konten sendiri.

BI tradisional

Program intelijen bisnis tradisional sangat bergantung pada personel TI. Mereka biasanya mengharuskan pengguna mengetahui SQL (bahasa pemrograman, lihat di bawah), dan dibutuhkan jauh lebih lama untuk mendapatkan jawaban, karena Anda harus memasukkan beberapa kueri secara manual dalam bahasa itu. Dengan demikian, mereka jauh kurang gesit, dan para ahli seperti di Gartner menyarankan pembeli untuk mencari jenis fitur yang ditemukan dalam program BI modern .

Perangkat lunak SaaS/Cloud

Perangkat lunak sebagai layanan adalah model di mana pembeli membeli lisensi untuk menggunakan perangkat lunak, daripada membeli dan menginstalnya. Sebagian besar perangkat lunak SaaS dilakukan melalui internet (yaitu, di cloud), yang mengurangi biaya pembelian dan pemasangan di muka. Ini juga menghilangkan kebutuhan untuk memantau server tempat perangkat lunak disimpan; perusahaan SaaS melacak setiap potensi pemadaman.

Iris-dan-dadu

Mengiris dan memotong kumpulan data besar untuk melihat data dari perspektif yang berbeda, atau melihat bagian tertentu secara lebih rinci. Kemampuan iris dan dadu adalah, misalnya, memungkinkan Anda memeriksa data berdasarkan minggu, lalu bulan, lalu setiap hari. Alih-alih menunggu laporan, irisan dan dadu memungkinkan Anda mengambil inisiatif dan memeriksa data spesifik saat Anda membutuhkannya.

SQL

Diucapkan "sekuel," SQL adalah bahasa pemrograman umum yang digunakan untuk mendapatkan informasi dari database. Jika Anda berbicara bahasa Inggris, database berbicara SQL, dan hanya akan tahu bagaimana menjawab pertanyaan yang diungkapkan seperti itu. Kecuali, tentu saja, perangkat lunak intelijen bisnis Anda memiliki kueri bahasa alami (NLQ), yang memungkinkan Anda mengajukan pertanyaan dengan cara yang sama seperti mesin pencari.

Istilah yang ingin Anda ketahui…

Atau yang menurut Anda akan bermanfaat bagi pembaca daftar ini? Beri tahu saya di komentar di bawah. Idealnya, bagian komentar bisa menjadi tempat lain bagi orang untuk meminta definisi, dan saya menyediakannya.

Jika Anda ingin mengetahui bagaimana persyaratan ini dapat membantu Anda dengan lebih baik, lihat salah satu opsi di direktori perangkat lunak intelijen bisnis Capterra , dan hubungi vendor.