Monday, February 23, 2015

DEEPFACE

Program Facebook Baru 'DeepFace'
Apakah Hanya Sebagai Creepy As It Sounds?
Facebook memiliki perpustakaan foto terbesar di dunia, dan sekarang memiliki teknologi untuk mencocokkan hampir semua wajah di dalamnya. Ya, bahkan yang tidak Anda tag.
Facebook mengumumkan pekan lalu bahwa dapat mengembangkan program yang disebutDeepFace," yang peneliti mengatakan dapat menentukan apakah dua wajah difoto adalah orang yang sama dengan Akurasi 97,25 persen.
Menurut Facebook, manusia dihukum sama jawaban tes dengan benar 97,53 persen dari waktu - hanya seperempat persen lebih baik dari pada Facebook software.
Facebook dasarnya telah terperangkap manusia ketika datang untuk mengingat wajah. Program ini dikembangkan oleh tiga in-house Peneliti Facebook dan seorang profesor di Tel Aviv University.
Sebagai contoh, para pengembang menunjukkan dalam sebuah makalah tentang program yang berhasil dapat DeepFace mengakui bahwa ini adalah pemenang Academy Award Sylvester Stallone.
Perangkat lunak pengenalan wajah Facebook adalah dapat menyarankan teman untuk menandaiketika Anda meng-upload foto, menggunakan informasi seperti jarak antara mata, hidung dan mata dalam gambar profil dan sudah tag foto. Namun hasil tersebut jauh lebih akurat dibandingkanDeepFace, yang menggunakan teknik dari pembelajaran dalam, bidang kecerdasan buatan mengkhususkan diri dalam memahami jenis tidak teratur data. Dalam rangka untuk wajah pertandingan yang lebih baik, para peneliti menciptakan sebuah "jaringan saraf" dalam perangkat lunak yang dimaksudkan untuk meniru sistem saraf pusat hewan. Untuk saat ini program ini, pertama kali dilaporkan oleh MIT Technology Review, hanya penelitian proyek dan tidak akan mempengaruhi 1,23 miliar orang yang secara teratur menggunakan Facebook.
Tapi CEO Mark Zuckerberg telah menyatakan dalam bunga dalam membangun keluar kecerdasan buatan Facebook kemampuan ketika berbicara dengan para investor di masa lalu. Ambisinya sebenarnya membentang di luar wajah pengakuan untuk menganalisis teks update status dan komentar untuk menguraikan suasana dan konteks. Ada tujuan bisnis di balik semua ini antusiasme intelektual Memahami semua informasi yang kita posting di jejaring sosial merupakan pusat untuk model bisnis Facebook, leverage yang data untuk mempersonalisasi iklan sehingga Anda akan lebih mungkin untuk klik pada mereka. Tumbuh kemampuan Facebook untuk mengenali Anda ketika teman upload foto dari liburan bersama-sama memiliki menarik perhatian pendukung privasi dan pejabat pemerintah sama. Sebagai contoh, lebih Pemerintah privasi-sadar Eropa memiliki sudah memaksa Facebook untuk menghapus semua data pengenalan wajah di sana.
Awal artikel diawali dengan pertanyaan apakah anda memiliki akun facebook? Pernahkah anda melakukan unggah foto difacebook? Pernahkah anda melakukan tagging nama teman diwajah pada foto yang anda unggah? Lalu pernahkah anda memikirkan bagaimana facebook bisa memberikan saran bahwa teman anda yang berada difoto tersebut? Bagaimana facebook tahu bahwa orang yang ada didalam foto adalah orang yang anda maksud? atau bahkan ada diri anda didalam foto tersebut. Face Recognition (Pengenalan Wajah) adalah jawaban yang paling cocok untuk menjawab pertanyaan tersebut.
Apakah tujuan face recognition? Sebuah usaha yang dilakukan manusia untuk memberikan kecerdasan pada mesin agar dapat mengenal dan membedakan individu berdasarkan karakteristik wajah masing – masing individu. Kemampuan ini sudah dimiliki oleh manusia pada umumnya, dengan melihat saja manusia mampu membedakan individu satu dengan yang lainnya. Kemampuan inilah yang berusaha ditanamkan pada mesin. Facebook adalah salah satu media sosial yang paling dikenal dan banyak digunakan didunia hingga saat ini. Berbagai kemampuan telah dimiliki oleh media jejaring sosial ini. Unggah text, video, gambar, artikel, link dan berbagai macam kejadian dan lokasi bisa dilakukan melalui facebook. Salah satu fitur yang dimiliki oleh facebook adalah pengenalan wajah secara otomatis. Pertanyaan selanjutnya adalah, bagaimana Facebook mampu menanamkan kecerdasan yang ada saat ini? Apa metode yang digunakan? Siapakah orang yang telah bekerja keras dalam pencapaian hingga saat ini. 
Pada tahun 2014 empat orang peneliti dari facebook laboratory dan Tel Aviv University (Yaniv Taigman, Ming Yang, Marc’Aurelio Ranzato, dan Lior Wolf) berhasil mengembangkan metode pendeteksian wajah dengan kemampuan yang hampir menyerupai kemampuan pengenalan manusia. DeepFace adalah nama metode yang digunakan dalam proses pengenalan wajah secara otomatis pada jejaring sosial facebook. Penjelasan detail mengenai metode DeepFace telah dipublikasikan dalam sebuah international conference dengan judul “DeepFace: Closing the Gap to Human-Level Performance in Face Verification”. DeepFace mampu mencapai akurasi hingga 97.35% hanya terpaut 0.18% dibawah kemampuan pengenalan manusia yakni sebesar 97.53% [1]. Pada metode DeepFace 9 layer deep neural network digunakan untuk membangun representasi 3D dari wajah. Proses pembelajaran menggunakan dataset wajah yang terbesar hingga saat ini. Dataset yang telah diberikan label dari 4 juta citra wajah dengan lebih dari 4000 identitas.
Gambar diatas menunjukkan arsitektur DeepFace. Proses representasi ini menghasilkan 120 Juta parameter. Warna pada gambar diatas menunjukkan feature maps dihasilkan pada setiap layer.
Perbandingan akurasi pengenalan wajah manusia menunjukkan bahwa DeepFace mampu mendekati performa pengenalan dari manusia. ROC Curve menunjukkan bahwa pengenalan DeepFace (Garis warna merah) memiliki nilai true positive paling mendekati pengenalan Dari otak manusia (garis warna hitam). Penggunaan metode DeepFace menurunkan kesalahan dari metode sebelumnya hingga 27%. Sehingga pencapaian akurasi dari metode ini hampir menyamai kemampuan manusia dalam mengenali wajah manusia. Penjelasan lengkap mengenai metode DeepFace dapat dilihat pada publikasi [1].
DeepLearning yang menjadi salah satu breakthrough technology tahun 2013 versi MIT Technology Review ternyata menjadi rahasia keakuratan facebook dalam mengenali wajah pada foto. Deep Learning tidak lepas kaitannya dengan Big Data, bagaimana menggali knowledge dari samudera data, dari data berskala raksasa. DeepFace adalah teknik biometrics yang dikembangkan oleh AI research group facebook. Membaca paper yg dipresentasikan di Conference on Computer Vision and Pattern Recognition (CVPR) bulan Juni yll. (https://www.facebook.com/publications/546316888800776/), ternyata facebook memakai deep learning untuk mencapai akurasi yang tinggi dalam mengenali wajah dari foto yang diupload oleh user. Model yang dipakai terdiri dari 9 layer neural network dengan lebih dari 120 juta parameter (maksudnya synapses). Model tersebut dilatih memakai 4 juta wajah dari 4000 identity (maksudnya 4000 orang, masing-masing rata-rata 1000 wajah). Waktu mengikuti kuliah dari Prof.Anil K.Jain di UI yll., sepertinya beliau kurang terkesan dengan deep learning. Tidak ada terobosan baru dalam deep learning, kecuali memakai jumlah layer yang jauh lebih banyak. Saya belum mendalami benar, apa kekuatan dalam deep learning sehingga demikian powerfull. Backpropagation algorithm yang dikembangkan Rumelhart tahun 1986 sendiri sebenarnya sudah cukup memuaskan dalam pattern recognition, hanya saja akan terkendala oleh local minima, saat dipakai untuk data berskala besar. Dulu di lab. saya memakai vector quantization type neural network untuk membreakdown large scale data (dalam studi mengenali ribuan huruf kanji, dan pemakaian ribusan sampel pada handwriting character recognition) sehingga diperoleh subset yang jauh lebih kecil, dan masing-masing diolah oleh 3-layered neural network. Tetapi untuk data jutaan, tentu dimensi masalahnya sudah berbeda. Kalau mengingat potensi data biometrics yang dimiliki Indonesia saat ini : 170 juta (vs paper group peneliti facebook hanya memakai 4000 orang), tentunya akan menjadi ladang subur bagi peneliti komputasi yang ingin mendalami DeepLearning.
Software pengenalan wajah milik Facebook yaitu DeepFace,kini sudah mencapai tingkat akurasi 97% lebih dan disebut-sebut mendekati level tingkat pengenalan wajah oleh manusia berdasarkan laporan yang dikeluarkan tim riset Facebook di link ini. Sesumbar atau tidak tentunya kita bertanya-tanya bagaimana cara software ini bisa mengenali wajah kita di tiap foto yang diupload ke Facebook?
Facebook menggunakan Software DeepFace ini untuk mengenali pengguna di foto dengan metode pertama mereka menggunakan ‘template’ dari Foto Profil dan/atau foto dengan wajah dimana kita di tag. fitur dari ‘template’ tersebut seperti bentuk hidung, jarak antar mata, bentuk mulut ataupun yang lain. Yang pasti fitur yang diambil adalah fitur-fitur diwajah yang secara umum tidak berubah seiring usia.
lalu bagaimana sebenarnya wajah kita terlihat software ini? gambar dibawah ini jawabannya :
Wajah kita di Facebook
Gambar diatas adalah contoh bagaimana wajah kita terlihat di DeepFace, data tersebut diatas lalu diproses dengan algoritma milik facebook untuk dengan cepat mengenali siapakah orang di foto tersebut. Hal ini tentunya mempermudah Facebook dalam memberikan fitur ini tanpa memberatkan server mereka sehingga pengguna tidak merasa terganggu dengan hadirnya fitur ini.
Di tahun 2013, dalam periode singkat user dapat mengunduh data ‘template’ wajah mereka di profil masing-masing (sayangnya sekarang sudah tidak bisa) dan diantara orang-orang yang beruntung dapat mengunduh data wajah mereka itu diantaranya adalah Brian House seorang guru di Rhode Island School of Design dan muridnya Jason Rabie. Mereka menampilkan data ‘template’ ini di galeri milik Brian House sebagai seni kontemporer yang berjudul ETERNAL PORTRAITS yang ditutup 9 maret 2014 kemarin.
Menurut Brian, data wajah DeepFace ini berbeda dengan foto biasa dimana foto hanya mengabadikan wajah dalam ekspresi tertentu namun data ‘template’ ini mengenali wajah selayaknya kita mengenali wajah orang lain dalam berbagai ekspresi, foto lainnya bisa dilihat di situs miliknya.
Terlepas dari kontroversi apakah ini mengganggu wilayah privasi pengguna, yang pasti ini merupakan salah satu pertanda bahwa Facebook benar-benar bekerja keras dalam meningkatkan ‘User Experience’ penggunanya dan menjadi Social Network terbaik saat ini.

Tuesday, February 3, 2015

Logistic Regression di SPSS

Regresi logistic merupakan salah satu analisi multivariate, yang berguna untuk memprediksi dependent variabel berdasarkan variabel independen.
Data
Pada logistic regresi, dependen variabel adalah variabel dikotomi (kategori). Ketika kategori variabel dependennya berjumlah dua kategori maka digunakan binary logistic, dan ketika dependen variabelnya lebih dari dua kategori maka digunakan multinominal logistic regression. Lalu ketika dependen variabelnya berbentuk ranking, maka disebut dengan ordinal logistic regression.
Konsep Regresi Logistik
Regresi logistik merupakan alternative uji jika asumsi multivariate normal distribution pada variabel bebasnya tidak bisa terpenuhi ketika akan dilakukan analisis diskriminan. Tidak terpenuhinya asumsi ini dikarenakan variabel bebas merupakan campuran antara variabel kontinyu (metric) dan kategorial (non metric). Misalnya, probabilitas bahwa orang yang menderita serangan jantung pada waktu tertentu dapat diprediksi dari informasi usia, kebiasaan merokok, jenis kelamin, dan lainnya.
Asumsi Regresi Logistik
  • Regresi logistik tidak membutuhkan hubungan linier antara variabel bebas dengan variabel terikat.
  • Regresi logistik dapat menyeleksi hubungan karena menggunakan pendekatan non linier log transformasi untuk memprediksi odds ratio. Odd dalam regresi logistik sering dinyatakan sebagai probabilitas. Misal Odd sebuah perusahaan dapat bangkrut atau berhasil atau odd seorang anak dapat lulus atau tidak pada Ujian Nasional.
  • Variabel bebas tidak memerlukan asumsi multivariate normality
  • Asumsi homokedastis tidak diperlukan
  • Variabel bebas tidak perlu dirubah ke bentuk metric (interval atau skala ratio)
CONTOH KASUS Logistic Regression
Data Yang Diberikan Adalah Data Fiktif Bukan Data Sebenarnya, Cuma Sebagai Latihan Uji Statistik
Seorang dokter ingin mengetahui probabilitas seorang pasien terkena penyakit jantung berdasarkan rutinitas kebiasaan merokok dan usia
Data dikumpulkan dari catatan medis sebanyak 30 orang pasien yang melakukan pemeriksaan kesehatan di RS ABC
SakitRokokUsia
1051
1146
1153
1055
1143
1133
1142
1142
1146
1151
1146
1146
1146
1151
1125
0129
0038
0031
0047
0050
0051
0141
0032
0042
0038
0040
0042
0033
0043
0046
Keterangan :
sakit (1), tidak sakit (0)
merokok (1), tdk merokok (0)
Usia (usia dalam tahun)
PENYELESAIAN KASUS
Pada menu Analyze, Pilih Regression >> Binary Logistic
Masukkan variabel sakit ke Dependent, kemudian variabel rokok dan usia ke “covariate box”
Kemudian, Klik Options, lalu beri tanda pada Classification Plots, Hosmer-Lemeshow GoF, Correlation matrix, dan itteration history
Klik Continue, kemudian OK
HASIL Dan INTERPRESTASI
Output didownload OUTPUT LOGISTIC REGRESSION 1
Menilai Model Fit
Untuk menilai model fit dapat diperhatikan nilai statistik -2LogL yaitu tanpa mengikutsertakan variabel hanya berupa konstanta yaitu sebesar 41.589. Ketika dimasukkan 2 variabel baru maka prediksi nilai -2LogL sebesar 16.750. Artinya terdapat penurunan sebesar 41.589 – 16.750 = 24.839.
Untuk -2LogL pertama diperoleh nilai 41.589 dengan df1 = 30-1 = 29. Nilai ini signifikan pada alpha 5% yang berarti Ho ditolak, artinya model tidak fit.
nilai -2LogL kedua adalah sebesar 16.750 dengan df2 = 30-3 = 27 adalah tidak signifikan pada alpha 5%. (Nilai statistik -2LogL di atas dibandingkan dengan nilai statistik distribusi x^2.), artinya model fit dengan data.
Statistik -LogL dapat digunakan untuk menentukan apakah jika variabel bebas dimasukkan dalam model dapat secara signifikan mempengaruhi model. dengan selisih 24.839 dan df(df1-df2=29-27=2) maka menunjukkan angka ini signifikan pada alpha 5%. Hal ini berarti Ho ditolak dan Model fit dengan data.
Cox n Snell’s R Square adalah ukuran pengaruh bersama yaitu sebesar 0.563 dan nilai Nagelkerke R Square adalah sebesar 0.751. dengan demikian dapat disimpulkan bahwa kemampuan variabel bebas menjelaskan model adalah sebesar 75.10%.
Selanjutnya, Hosmer and Lemeshow’s GoF dilakukan untuk menguji hipotesis. Jika sig < 0.05 maka Ho ditolak yang berarti ada perbedaan signifikan antara model dengan nilai observasinya. Jika sig > 0.05 maka Ho diterima, artinya tidak ada perbedaan antara model dan nilai observasinya.
statistik Hosmer and Lemeshow’s GoF diperoleh sebesar 0.594 (> 0.05) sehingga dapat dinyatakan bahwa model fit dengan data. Hosmer and Lemeshow’s GoF juga menghasilkan nilai 6.475 dengan probabilitas sebesar 0,594 sehingga dapat disimpulkan bahwa model fit dengan data.
Estimasi Parameter dan Interprestasi
Estimasi Maximum Likehood parameter model dapat dilihat dari output pada tabel Variables in the Equation. Logistic Regression kemudian dapat dinyatakan :
Ln P/1-P = -11.506 + 5.348 Rokok + .210 Usia.
Variabel bebas kebiasaan merokok signifikan dengan probabilitas sebesar 0.004 (< 0.05) dan variabel usia juga signifikan dengan probabilitas 0.032. dengan memperhatikan persamaan ini maka dapat diinterprestasikan sbb :
Log of Odds seseorang terkena secara positif berhubungan dengan rokok. Probabilitas atau Odds seorang terkena penyakit jantung jika ia perokok adalah sebesar 5.348. artinya seorang perokok memiliki kemungkinan terkena serangan jantung 5.35 kali lebih besar dibanding yang tidak merokok.
Jika variabel rokok dianggap konstan, maka probabilitas seseorang terkena serangan jantung adalah sebesar 0.210 pada setiap kenaikan satu tahun usia.
Jika Rokok dianggap konstan, maka seseorang memiliki odds terkena penyakit jantung adalah sebesar 1.233 untuk setiap penambahan usia. Sementara jika usia bernilai konstan maka odds seorang terkena penyakit jantung adalah sebesar 210.286 untuk perokok dibandingkan dengan yang tidak merokok. Hasil overall clasification rate adalah sebesar 90.0% pada cutoff 50%
Kesimpulan
  • Pertama. Variabel rokok dan usia memiliki hubungan positif dengan odds penyakit jantung
  • Kedua. Jika usia bernilai konstan, maka seorang perokok memiliki odds terkena penyakit jantung sebesar 5.384 kali lebih besar dibanding yang tidak merokok
  • Ketiga. Jika rokok bernilai konstan, maka odds seorang terkena penyakit jantung adalah sebesar 0.210 pada setiap penambahan usia.