Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Must-have Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния

Π­Ρ‚ΠΎΡ‚ пост β€” ΠΊΡ€Π°Ρ‚ΠΊΠΈΠΉ ΠΎΠ±Π·ΠΎΡ€ ΠΎΠ±Ρ‰ΠΈΡ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния. К ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ прилагаСтся ΠΊΡ€Π°Ρ‚ΠΊΠΎΠ΅ описаниС, Π³Π°ΠΉΠ΄Ρ‹ ΠΈ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Π΅ ссылки.

ΠœΠ΅Ρ‚ΠΎΠ΄ Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ (PCA)/SVD

Π­Ρ‚ΠΎ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· основных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния. ΠŸΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ‚ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ…, потСряв наимСньшСС количСство ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ. ΠŸΡ€ΠΈΠΌΠ΅Π½ΡΠ΅Ρ‚ΡΡ Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… областях, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ распознаваниС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½ΠΎΠ΅ Π·Ρ€Π΅Π½ΠΈΠ΅, сТатиС Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Ρ‚. ΠΏ. ВычислСниС Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ сводится ΠΊ Π²Ρ‹Ρ‡ΠΈΡΠ»Π΅Π½ΠΈΡŽ собствСнных Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² ΠΈ собствСнных Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΊΠΎΠ²Π°Ρ€ΠΈΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ исходных Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ ΠΊ сингулярному Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΡŽ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ….

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

SVD β€” это способ вычислСния упорядочСнных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ΠΎΠ².

ΠœΠ΅Ρ‚ΠΎΠ΄ Π½Π°ΠΈΠΌΠ΅Π½ΡŒΡˆΠΈΡ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ²

ΠœΠ΅Ρ‚ΠΎΠ΄ Π½Π°ΠΈΠΌΠ΅Π½ΡŒΡˆΠΈΡ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ² β€” матСматичСский ΠΌΠ΅Ρ‚ΠΎΠ΄, примСняСмый для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡, основанный Π½Π° ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ суммы ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ² ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠΉ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΎΡ‚ искомых ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…. Он ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для Β«Ρ€Π΅ΡˆΠ΅Π½ΠΈΡΒ» ΠΏΠ΅Ρ€Π΅ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… систСм ΡƒΡ€Π°Π²Π½Π΅Π½ΠΈΠΉ (ΠΊΠΎΠ³Π΄Π° количСство ΡƒΡ€Π°Π²Π½Π΅Π½ΠΈΠΉ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Π΅Ρ‚ количСство нСизвСстных), для поиска Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π² случаС ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ… (Π½Π΅ ΠΏΠ΅Ρ€Π΅ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ…) Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… систСм ΡƒΡ€Π°Π²Π½Π΅Π½ΠΈΠΉ, Π° Ρ‚Π°ΠΊΠΆΠ΅ для аппроксимации Ρ‚ΠΎΡ‡Π΅Ρ‡Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ этот Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ простым ΠΊΡ€ΠΈΠ²Ρ‹ΠΌ/рСгрСссии.

ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Π°Ρ линСйная рСгрСссия

ΠœΠ΅Ρ‚ΠΎΠ΄ Π½Π°ΠΈΠΌΠ΅Π½ΡŒΡˆΠΈΡ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ² ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠΌΡƒΡ‚ΠΈΡ‚ΡŒ выбросами, Π»ΠΎΠΆΠ½Ρ‹ΠΌΠΈ полями ΠΈ Ρ‚. Π΄. НуТны ограничСния, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ Π΄ΠΈΡΠΏΠ΅Ρ€ΡΠΈΡŽ Π»ΠΈΠ½ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΡ‹ ΠΏΠΎΠΌΠ΅Ρ‰Π°Π΅ΠΌ Π² Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…. ΠŸΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии, которая Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€ΡƒΠ΅Ρ‚, Ρ‡Ρ‚ΠΎ вСса Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ вСсти сСбя β€œΠΏΠ»ΠΎΡ…ΠΎβ€. МодСли ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΠΌΠ΅Ρ‚ΡŒ Π½ΠΎΡ€ΠΌΡƒ L1 (LASSO) ΠΈΠ»ΠΈ L2 (Ridge Regression) ΠΈΠ»ΠΈ ΠΎΠ±Π΅ (elastic regression).

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ этот Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ для соотвСтствия линиям рСгрСссии с ограничСниями, избСгая пСрСопрСдСлСния.

ΠœΠ΅Ρ‚ΠΎΠ΄ k-срСдних

ВсСми Π»ΡŽΠ±ΠΈΠΌΡ‹ΠΉ Π½Π΅ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ кластСризации. Учитывая Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… Π² Π²ΠΈΠ΄Π΅ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ², ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ кластСры Ρ‚ΠΎΡ‡Π΅ΠΊ Π½Π° основС расстояний ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ. Π­Ρ‚ΠΎ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Ρ‰Π°Π΅Ρ‚ Ρ†Π΅Π½Ρ‚Ρ€Ρ‹ кластСров, Π° Π·Π°Ρ‚Π΅ΠΌ Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΡƒΠ΅Ρ‚ Ρ‚ΠΎΡ‡ΠΊΠΈ с ΠΊΠ°ΠΆΠ΄Ρ‹ΠΌ Ρ†Π΅Π½Ρ‚Ρ€ΠΎΠΌ кластСра. Π’Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ – количСство кластСров, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄ΠΎΠ»ΠΆΠ½Ρ‹ Π±Ρ‹Ρ‚ΡŒ созданы, ΠΈ количСство ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

ЛогистичСская рСгрСссия

ЛогистичСская рСгрСссия ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π° Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссиСй с Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΡΡ‚ΡŒΡŽ (Π² основном ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ сигмоидальная функция ΠΈΠ»ΠΈ tanh) послС примСнСния вСсов, ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ Π²Ρ‹Ρ…ΠΎΠ΄ΠΎΠ² ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ΅Π½ΠΎ ΠΊ + / β€” классам (Ρ‡Ρ‚ΠΎ Ρ€Π°Π²Π½ΠΎ 1 ΠΈ 0 Π² случаС сигмоида). Π€ΡƒΠ½ΠΊΡ†ΠΈΠΈ кросс-энтропийной ΠΏΠΎΡ‚Π΅Ρ€ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ с использованиСм ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ спуска.

ΠŸΡ€ΠΈΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅ для Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΡ…: логистичСская рСгрСссия ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для классификации, Π° Π½Π΅ рСгрСссии. Π’ Ρ†Π΅Π»ΠΎΠΌ, ΠΎΠ½Π° схоТа с однослойной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ ΡΠ΅Ρ‚ΡŒΡŽ. ΠžΠ±ΡƒΡ‡Π°Π΅Ρ‚ΡΡ с использованиСм ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹ΠΉ спуск ΠΈΠ»ΠΈ L-BFGS. NLP-Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ Π΅Ρ‘, называя β€œΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠ΅ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ максимальной энтропии”.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ LR для обучСния простых, Π½ΠΎ ΠΎΡ‡Π΅Π½ΡŒ β€œΠΊΡ€Π΅ΠΏΠΊΠΈΡ…β€ классификаторов.

SVM (ΠœΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ²)

SVM – линСйная модСль, такая ΠΊΠ°ΠΊ линСйная/логистичСская рСгрСссия. Π Π°Π·Π½ΠΈΡ†Π° Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½Π° ΠΈΠΌΠ΅Π΅Ρ‚ margin-based Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ. Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΏΠΎΡ‚Π΅Ρ€ΡŒ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, L-BFGS ΠΈΠ»ΠΈ SGD.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Одна ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Π°Ρ Π²Π΅Ρ‰ΡŒ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΌΠΎΠ³ΡƒΡ‚ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ SVM – это ΠΈΠ·ΡƒΡ‡Π΅Π½ΠΈΠ΅ классификаторов классов.

SVM ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для обучСния классификаторов (Π΄Π°ΠΆΠ΅ рСгрСссоров).

НСйронныС сСти прямого распространСния

Π’ основном, это ΠΌΠ½ΠΎΠ³ΠΎΡƒΡ€ΠΎΠ²Π½Π΅Π²Ρ‹Π΅ классификаторы логистичСской рСгрСссии. МногиС слои вСсов Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Ρ‹ нСлинСйностями (sigmoid, tanh, relu + softmax ΠΈ cool new selu). Π’Π°ΠΊΠΆΠ΅ ΠΎΠ½ΠΈ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ многослойными ΠΏΠ΅Ρ€Ρ†Π΅ΠΏΡ‚Ρ€ΠΎΠ½Π°ΠΌΠΈ. FFNN ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Ρ‹ для классификации ΠΈ β€œΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡ Π±Π΅Π· учитСля” Π² качСствС автоэнкодСров.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

FFNN ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для обучСния классификатора ΠΈΠ»ΠΈ извлСчСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π² качСствС автоэнкодСров.

Π‘Π²Ρ‘Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти

ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΈ всС соврСмСнныС достиТСния Π² области машинного обучСния Π±Ρ‹Π»ΠΈ достигнуты с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ свёрточных Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй. Они ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ для классификации ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, обнаруТСния ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΈΠ»ΠΈ Π΄Π°ΠΆΠ΅ сСгмСнтации ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ. Π˜Π·ΠΎΠ±Ρ€Π΅Ρ‚Π΅Π½Π½Ρ‹Π΅ Π―Π½ΠΎΠΌ Π›Π΅ΠΊΡƒΠ½ΠΎΠΌ Π² Π½Π°Ρ‡Π°Π»Π΅ 90-Ρ… Π³ΠΎΠ΄ΠΎΠ², сСти ΠΈΠΌΠ΅ΡŽΡ‚ свСрточныС слои, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Π΅ΠΉΡΡ‚Π²ΡƒΡŽΡ‚ ΠΊΠ°ΠΊ иСрархичСскиС экстракторы ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ². Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ… для Ρ€Π°Π±ΠΎΡ‚Ρ‹ с тСкстом (ΠΈ Π΄Π°ΠΆΠ΅ для Ρ€Π°Π±ΠΎΡ‚Ρ‹ с Π³Ρ€Π°Ρ„ΠΈΠΊΠΎΠΉ).

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Π Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½Ρ‹Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти (RNNs)

RNNs ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΡƒΡŽΡ‚ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ, примСняя ΠΎΠ΄ΠΈΠ½ ΠΈ Ρ‚ΠΎΡ‚ ΠΆΠ΅ Π½Π°Π±ΠΎΡ€ вСсов рСкурсивно ΠΊ ΡΠΎΡΡ‚ΠΎΡΠ½ΠΈΡŽ Π°Π³Ρ€Π΅Π³Π°Ρ‚ΠΎΡ€Π° Π² ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ t ΠΈ Π²Ρ…ΠΎΠ΄ Π² ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ t. ЧистыС RNN Ρ€Π΅Π΄ΠΊΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ сСйчас, Π½ΠΎ Π΅Π³ΠΎ Π°Π½Π°Π»ΠΎΠ³ΠΈ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, LSTM ΠΈ GRU ΡΠ²Π»ΡΡŽΡ‚ΡΡ самыми соврСмСнными Π² Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ Π·Π°Π΄Π°Ρ‡ модСлирования ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. LSTM, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ вмСсто простого ΠΏΠ»ΠΎΡ‚Π½ΠΎΠ³ΠΎ слоя Π² чистой RNN.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ RNN для любой Π·Π°Π΄Π°Ρ‡ΠΈ классификации тСкста, машинного ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄Π°, модСлирования языка.

УсловныС случайныС поля (CRFs)

Они ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ для модСлирования ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ, ΠΊΠ°ΠΊ RNN, ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π² сочСтании с RNN. Они Ρ‚Π°ΠΊΠΆΠ΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Ρ‹ Π² Π΄Ρ€ΡƒΠ³ΠΈΡ… Π·Π°Π΄Π°Ρ‡Π°Ρ… структурированных прогнозирования, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π² сСгмСнтации изобраТСния. CRF ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ элСмСнт ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ (допустим, ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅), Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎ сосСди Π²Π»ΠΈΡΡŽΡ‚ Π½Π° ΠΌΠ΅Ρ‚ΠΊΡƒ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Π° Π² ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ, Π° Π½Π΅ Π½Π° всС ΠΌΠ΅Ρ‚ΠΊΠΈ, нСзависимыС Π΄Ρ€ΡƒΠ³ ΠΎΡ‚ Π΄Ρ€ΡƒΠ³Π°.

Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠΉΡ‚Π΅ CRF для связки ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚Π΅ΠΉ (Π² тСкстС, ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ, Π²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΌ ряду, Π”ΠΠš ΠΈ Ρ‚. Π΄.).

Π”Π΅Ρ€Π΅Π²ΡŒΡ принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΈ случайныС лСса

Один ΠΈΠ· самых распространённых Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² статистикС ΠΈ Π°Π½Π°Π»ΠΈΠ·Π΅ Π΄Π°Π½Π½Ρ‹Ρ… для ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π° прСдставляСт собой β€œΠ»ΠΈΡΡ‚ΡŒΡβ€ ΠΈ β€œΠ²Π΅Ρ‚ΠΊΠΈβ€. На β€œΠ²Π΅Ρ‚ΠΊΠ°Ρ…β€ Π΄Π΅Ρ€Π΅Π²Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ записаны Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρ‹, ΠΎΡ‚ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… зависит цСлСвая функция, Π² β€œΠ»ΠΈΡΡ‚ΡŒΡΡ…β€ записаны значСния Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, Π° Π² ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Ρ… ΡƒΠ·Π»Π°Ρ… – Π°Ρ‚Ρ€ΠΈΠ±ΡƒΡ‚Ρ‹, ΠΏΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‚ΡΡ случаи.

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π½ΠΎΠ²Ρ‹ΠΉ случай, Π½Π°Π΄ΠΎ ΡΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒΡΡ ΠΏΠΎ Π΄Π΅Ρ€Π΅Π²Ρƒ Π΄ΠΎ листа ΠΈ Π²Ρ‹Π΄Π°Ρ‚ΡŒ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅Π΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅. ЦСль состоит Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ модСль, которая прСдсказываСт Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ρ†Π΅Π»Π΅Π²ΠΎΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ Π½Π° основС Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ….

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅ Π² машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

1.1 Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅

Благодаря ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠΌΡƒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ программист Π½Π΅ обязан ΠΏΠΈΡΠ°Ρ‚ΡŒ инструкции, ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‰ΠΈΠ΅ всС Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ ΠΈ содСрТащиС всС Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ. ВмСсто этого Π² ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ (ΠΈΠ»ΠΈ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΡƒΡŽ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡƒ) Π·Π°ΠΊΠ»Π°Π΄Ρ‹Π²Π°ΡŽΡ‚ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ нахоТдСния Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΏΡƒΡ‚Ρ‘ΠΌ комплСксного использования статистичСских Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… выводятся закономСрности ΠΈ Π½Π° основС ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π΄Π΅Π»Π°ΡŽΡ‚ΡΡ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹.

ВСхнология машинного обучСния Π½Π° основС Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Ρ€Ρ‘Ρ‚ Π½Π°Ρ‡Π°Π»ΠΎ Π² 1950 Π³ΠΎΠ΄Ρƒ, ΠΊΠΎΠ³Π΄Π° Π½Π°Ρ‡Π°Π»ΠΈ Ρ€Π°Π·Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ ΠΏΠ΅Ρ€Π²Ρ‹Π΅ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡ‹ для ΠΈΠ³Ρ€Ρ‹ Π² шашки. Π—Π° ΠΏΡ€ΠΎΡˆΠ΅Π΄ΡˆΠΈΠ΅ дСсятилСтий ΠΎΠ±Ρ‰ΠΈΠΉ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏ Π½Π΅ измСнился. Π—Π°Ρ‚ΠΎ благодаря Π²Π·Ρ€Ρ‹Π²Π½ΠΎΠΌΡƒ росту Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… мощностСй ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ΠΎΠ² ΠΌΠ½ΠΎΠ³ΠΎΠΊΡ€Π°Ρ‚Π½ΠΎ ΡƒΡΠ»ΠΎΠΆΠ½ΠΈΠ»ΠΈΡΡŒ закономСрности ΠΈ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹, создаваСмыС ΠΈΠΌΠΈ, ΠΈ Ρ€Π°ΡΡˆΠΈΡ€ΠΈΠ»ΡΡ ΠΊΡ€ΡƒΠ³ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ ΠΈ Π·Π°Π΄Π°Ρ‡, Ρ€Π΅ΡˆΠ°Π΅ΠΌΡ‹Ρ… с использованиСм машинного обучСния.

Π§Ρ‚ΠΎΠ±Ρ‹ Π·Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ процСсс машинного ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, для Π½Π°Ρ‡Π°Π»Π° Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π·Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚ΡŒ Π² ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ ДатасСт(Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ количСство исходных Π΄Π°Π½Π½Ρ‹Ρ…), Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π±ΡƒΠ΄Π΅Ρ‚ ΡƒΡ‡ΠΈΡ‚ΡŒΡΡ ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ запросы. НапримСр, ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎΠ³Ρ€Π°Ρ„ΠΈΠΈ собак ΠΈ ΠΊΠΎΡ‚ΠΎΠ², Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΡƒΠΆΠ΅ Π΅ΡΡ‚ΡŒ ΠΌΠ΅Ρ‚ΠΊΠΈ, ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π°ΡŽΡ‰ΠΈΠ΅ ΠΊ ΠΊΠΎΠΌΡƒ ΠΎΠ½ΠΈ относятся. ПослС процСсса обучСния, ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ° ΡƒΠΆΠ΅ сама смоТСт Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚ΡŒ собак ΠΈ ΠΊΠΎΡ‚ΠΎΠ² Π½Π° Π½ΠΎΠ²Ρ‹Ρ… изобраТСниях Π±Π΅Π· содСрТания ΠΌΠ΅Ρ‚ΠΎΠΊ. ΠŸΡ€ΠΎΡ†Π΅ΡΡ обучСния продолТаСтся ΠΈ послС Π²Ρ‹Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ², Ρ‡Π΅ΠΌ большС Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΡ‹ ΠΏΡ€ΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π»ΠΈ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠΎΠΉ, Ρ‚Π΅ΠΌ Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½ΠΎ ΠΎΠ½Π° распознаСт Π½ΡƒΠΆΠ½Ρ‹Π΅ изобраТСния.

Благодаря ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠΌΡƒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Ρ‹ учатся Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Ρ‚ΡŒ Π½Π° фотографиях ΠΈ рисунках Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π»ΠΈΡ†Π°, Π½ΠΎ ΠΈ ΠΏΠ΅ΠΉΠ·Π°ΠΆΠΈ, ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚Ρ‹, тСкст ΠΈ Ρ†ΠΈΡ„Ρ€Ρ‹. Π§Ρ‚ΠΎ касаСтся тСкста, Ρ‚ΠΎ ΠΈ здСсь Π½Π΅ ΠΎΠ±ΠΎΠΉΡ‚ΠΈΡΡŒ Π±Π΅Π· машинного обучСния: функция ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΈ Π³Ρ€Π°ΠΌΠΌΠ°Ρ‚ΠΈΠΊΠΈ сСйчас присутствуСт Π² любом тСкстовом Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΎΡ€Π΅ ΠΈ Π΄Π°ΠΆΠ΅ Π² Ρ‚Π΅Π»Π΅Ρ„ΠΎΠ½Π°Ρ…. ΠŸΡ€ΠΈΡ‡Π΅ΠΌ учитываСтся Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ написаниС слов, Π½ΠΎ ΠΈ контСкст, ΠΎΡ‚Ρ‚Π΅Π½ΠΊΠΈ смысла ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Ρ‚ΠΎΠ½ΠΊΠΈΠ΅ лингвистичСскиС аспСкты. Π‘ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΠ³ΠΎ, ΡƒΠΆΠ΅ сущСствуСт ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ΅ обСспСчСниС, способноС Π±Π΅Π· участия Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° ΠΏΠΈΡΠ°Ρ‚ΡŒ новостныС ΡΡ‚Π°Ρ‚ΡŒΠΈ (Π½Π° Ρ‚Π΅ΠΌΡƒ экономики ΠΈ, ΠΊ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ, спорта).

1.2 Π’ΠΈΠΏΡ‹ Π·Π°Π΄Π°Ρ‡ машинного обучСния

ВсС Π·Π°Π΄Π°Ρ‡ΠΈ, Ρ€Π΅ΡˆΠ°Π΅ΠΌΡ‹Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ML, относятся ΠΊ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.

1)Π—Π°Π΄Π°Ρ‡Π° рСгрСссии – ΠΏΡ€ΠΎΠ³Π½ΠΎΠ· Π½Π° основС Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² с Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌΠΈ. На Π²Ρ‹Ρ…ΠΎΠ΄Π΅ Π΄ΠΎΠ»ΠΆΠ½ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒΡΡ вСщСствСнноС число (2, 35, 76.454 ΠΈ Π΄Ρ€.), ΠΊ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ Ρ†Π΅Π½Π° ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€Ρ‹, ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒ Ρ†Π΅Π½Π½ΠΎΠΉ Π±ΡƒΠΌΠ°Π³ΠΈ ΠΏΠΎ ΠΏΡ€ΠΎΡˆΠ΅ΡΡ‚Π²ΠΈΠΈ ΠΏΠΎΠ»ΡƒΠ³ΠΎΠ΄Π°, ΠΎΠΆΠΈΠ΄Π°Π΅ΠΌΡ‹ΠΉ Π΄ΠΎΡ…ΠΎΠ΄ ΠΌΠ°Π³Π°Π·ΠΈΠ½Π° Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ мСсяц, качСство Π²ΠΈΠ½Π° ΠΏΡ€ΠΈ слСпом тСстировании.

2)Π—Π°Π΄Π°Ρ‡Π° классификации – ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΎΡ‚Π²Π΅Ρ‚Π° Π½Π° основС Π½Π°Π±ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². Π˜ΠΌΠ΅Π΅Ρ‚ ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠ΅ количСство ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² (ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π΅ Β«Π΄Π°Β» ΠΈΠ»ΠΈ Β«Π½Π΅Ρ‚Β»): Π΅ΡΡ‚ΡŒ Π»ΠΈ Π½Π° Ρ„ΠΎΡ‚ΠΎΠ³Ρ€Π°Ρ„ΠΈΠΈ ΠΊΠΎΡ‚, являСтся Π»ΠΈ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ чСловСчСским Π»ΠΈΡ†ΠΎΠΌ, Π±ΠΎΠ»Π΅Π½ Π»ΠΈ ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚ Ρ€Π°ΠΊΠΎΠΌ.

3)Π—Π°Π΄Π°Ρ‡Π° кластСризации – распрСдСлСниС Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° Π³Ρ€ΡƒΠΏΠΏΡ‹: Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ всСх ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² мобильного ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΎΡ€Π° ΠΏΠΎ ΡƒΡ€ΠΎΠ²Π½ΡŽ платёТСспособности, отнСсСниС космичСских ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΊ Ρ‚ΠΎΠΉ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠΉ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ (ΠΏΠ»Π°Π½Π΅Ρ‚Π°, Π·Π²Ρ‘Π·Π΄Π°, чёрная Π΄Ρ‹Ρ€Π° ΠΈ Ρ‚. ΠΏ.).

4)Π—Π°Π΄Π°Ρ‡Π° ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ размСрности – свСдСниС большого числа ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΊ ΠΌΠ΅Π½ΡŒΡˆΠ΅ΠΌΡƒ (ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ 2–3) для удобства ΠΈΡ… ΠΏΠΎΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, сТатиС Π΄Π°Π½Π½Ρ‹Ρ…).

5)Π—Π°Π΄Π°Ρ‡Π° выявлСния Π°Π½ΠΎΠΌΠ°Π»ΠΈΠΉ – ΠΎΡ‚Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π°Π½ΠΎΠΌΠ°Π»ΠΈΠΉ ΠΎΡ‚ стандартных случаСв. На ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ взгляд ΠΎΠ½Π° совпадаСт с Π·Π°Π΄Π°Ρ‡Π΅ΠΉ классификации, Π½ΠΎ Π΅ΡΡ‚ΡŒ ΠΎΠ΄Π½ΠΎ сущСствСнноС ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅: Π°Π½ΠΎΠΌΠ°Π»ΠΈΠΈ – явлСниС Ρ€Π΅Π΄ΠΊΠΎΠ΅, ΠΈ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΡ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ², Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ Π½Π°Ρ‚Π°ΡΠΊΠ°Ρ‚ΡŒ машинно ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΡƒΡŽΡΡ модСль Π½Π° выявлСниС Ρ‚Π°ΠΊΠΈΡ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², Π»ΠΈΠ±ΠΎ ΠΈΡΡ‡Π΅Π·Π°ΡŽΡ‰Π΅ ΠΌΠ°Π»ΠΎ, Π»ΠΈΠ±ΠΎ просто Π½Π΅Ρ‚, поэтому ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ классификации здСсь Π½Π΅ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚. На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ Ρ‚Π°ΠΊΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ΠΉ являСтся, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, выявлСниС ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΠΊΠΈΡ… дСйствий с банковскими ΠΊΠ°Ρ€Ρ‚Π°ΠΌΠΈ.

1.3 ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ Π²ΠΈΠ΄Ρ‹ машинного обучСния

Основная масса Π·Π°Π΄Π°Ρ‡, Ρ€Π΅ΡˆΠ°Π΅ΠΌΡ‹Ρ… ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² машинного обучСния, относится ΠΊ Π΄Π²ΡƒΠΌ Ρ€Π°Π·Π½Ρ‹ΠΌ Π²ΠΈΠ΄Π°ΠΌ: ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ (supervised learning) Π»ΠΈΠ±ΠΎ Π±Π΅Π· Π½Π΅Π³ΠΎ (unsupervised learning). Однако этим ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ вовсС Π½Π΅ ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ являСтся сам программист, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ стоит Π½Π°Π΄ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ΠΎΠΌ ΠΈ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΊΠ°ΠΆΠ΄ΠΎΠ΅ дСйствиС Π² ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ΅. Β«Π£Ρ‡ΠΈΡ‚Π΅Π»ΡŒΒ» Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… машинного обучСния – это само Π²ΠΌΠ΅ΡˆΠ°Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΠΎ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° Π² процСсс ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ. Π’ ΠΎΠ±ΠΎΠΈΡ… Π²ΠΈΠ΄Π°Ρ… обучСния машинС ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ΡΡ исходныС Π΄Π°Π½Π½Ρ‹Π΅, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΅ΠΉ прСдстоит ΠΏΡ€ΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈ Π½Π°ΠΉΡ‚ΠΈ закономСрности. Π Π°Π·Π»ΠΈΡ‡ΠΈΠ΅ лишь Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ Π΅ΡΡ‚ΡŒ ряд Π³ΠΈΠΏΠΎΡ‚Π΅Π·, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΠΎΠΏΡ€ΠΎΠ²Π΅Ρ€Π³Π½ΡƒΡ‚ΡŒ ΠΈΠ»ΠΈ ΠΏΠΎΠ΄Ρ‚Π²Π΅Ρ€Π΄ΠΈΡ‚ΡŒ. Π­Ρ‚Ρƒ Ρ€Π°Π·Π½ΠΈΡ†Ρƒ Π»Π΅Π³ΠΊΠΎ ΠΏΠΎΠ½ΡΡ‚ΡŒ Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ….

МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ

ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, Π² нашСм распоряТСнии оказались свСдСния ΠΎ дСсяти тысячах московских ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€: ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ, этаТ, Ρ€Π°ΠΉΠΎΠ½, Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ ΠΈΠ»ΠΈ отсутствиС ΠΏΠ°Ρ€ΠΊΠΎΠ²ΠΊΠΈ Ρƒ Π΄ΠΎΠΌΠ°, расстояниС ΠΎΡ‚ ΠΌΠ΅Ρ‚Ρ€ΠΎ, Ρ†Π΅Π½Π° ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€Ρ‹ ΠΈ Ρ‚. ΠΏ. Нам Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ модСль, ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰ΡƒΡŽ Ρ€Ρ‹Π½ΠΎΡ‡Π½ΡƒΡŽ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒ ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€Ρ‹ ΠΏΠΎ Π΅Ρ‘ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π°ΠΌ. Π­Ρ‚ΠΎ ΠΈΠ΄Π΅Π°Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ машинного обучСния с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ: Ρƒ нас Π΅ΡΡ‚ΡŒ исходныС Π΄Π°Π½Π½Ρ‹Π΅ (количСство ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€ ΠΈ ΠΈΡ… свойства, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌΠΈ) ΠΈ Π³ΠΎΡ‚ΠΎΠ²Ρ‹ΠΉ ΠΎΡ‚Π²Π΅Ρ‚ ΠΏΠΎ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· ΠΊΠ²Π°Ρ€Ρ‚ΠΈΡ€ – Π΅Ρ‘ ΡΡ‚ΠΎΠΈΠΌΠΎΡΡ‚ΡŒ. ΠŸΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ΅ прСдстоит Ρ€Π΅ΡˆΠΈΡ‚ΡŒ Π·Π°Π΄Π°Ρ‡Ρƒ рСгрСссии.

Π•Ρ‰Ρ‘ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΈΠ· ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠΈ: ΠΏΠΎΠ΄Ρ‚Π²Π΅Ρ€Π΄ΠΈΡ‚ΡŒ ΠΈΠ»ΠΈ ΠΎΠΏΡ€ΠΎΠ²Π΅Ρ€Π³Π½ΡƒΡ‚ΡŒ Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Ρ€Π°ΠΊΠ° Ρƒ ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚Π°, зная всС Π΅Π³ΠΎ мСдицинскиС ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ. Π’Ρ‹ΡΡΠ½ΠΈΡ‚ΡŒ, являСтся Π»ΠΈ входящСС письмо спамом, ΠΏΡ€ΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π² Π΅Π³ΠΎ тСкст. Π­Ρ‚ΠΎ всё Π·Π°Π΄Π°Ρ‡ΠΈ Π½Π° ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡŽ.

МашинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Π±Π΅Π· учитСля

Π’ случаС обучСния Π±Π΅Π· учитСля, ΠΊΠΎΠ³Π΄Π° Π³ΠΎΡ‚ΠΎΠ²Ρ‹Ρ… Β«ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ²Β» систСмС Π½Π΅ прСдоставлСно, всё обстоит Π΅Ρ‰Ρ‘ интСрСснСС. НапримСр, Ρƒ нас Π΅ΡΡ‚ΡŒ информация ΠΎ вСсС ΠΈ ростС ΠΊΠ°ΠΊΠΎΠ³ΠΎ-Ρ‚ΠΎ количСства людСй, ΠΈ эти Π΄Π°Π½Π½Ρ‹Π΅ Π½ΡƒΠΆΠ½ΠΎ Ρ€Π°ΡΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΏΠΎ Ρ‚Ρ€Ρ‘ΠΌ Π³Ρ€ΡƒΠΏΠΏΠ°ΠΌ, для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… прСдстоит ΠΏΠΎΡˆΠΈΡ‚ΡŒ Ρ€ΡƒΠ±Π°ΡˆΠΊΠΈ подходящих Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠ². Π­Ρ‚ΠΎ Π·Π°Π΄Π°Ρ‡Π° кластСризации. Π’ этом случаС прСдстоит Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ всС Π΄Π°Π½Π½Ρ‹Π΅ Π½Π° 3 кластСра (Π½ΠΎ, ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, Ρ‚Π°ΠΊΠΎΠ³ΠΎ строгого ΠΈ СдинствСнно Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ³ΠΎ дСлСния Π½Π΅Ρ‚).

Если Π²Π·ΡΡ‚ΡŒ Π΄Ρ€ΡƒΠ³ΡƒΡŽ ΡΠΈΡ‚ΡƒΠ°Ρ†ΠΈΡŽ, ΠΊΠΎΠ³Π΄Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π² Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ сотнСй Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‚ΠΎ основной Ρ‚Ρ€ΡƒΠ΄Π½ΠΎΡΡ‚ΡŒΡŽ Π±ΡƒΠ΄Π΅Ρ‚ графичСскоС ΠΎΡ‚ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ Ρ‚Π°ΠΊΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ количСство ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°ΡŽΡ‚ Π΄ΠΎ Π΄Π²ΡƒΡ… ΠΈΠ»ΠΈ Ρ‚Ρ€Ρ‘Ρ…, ΠΈ становится Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹ΠΌ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ… Π½Π° плоскости ΠΈΠ»ΠΈ Π² 3D. Π­Ρ‚ΠΎ – Π·Π°Π΄Π°Ρ‡Π° ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ размСрности.

1.4 ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ машинного обучСния

1. Π”Π΅Ρ€Π΅Π²ΠΎ принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ

Π­Ρ‚ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, основанный Π½Π° использовании Π΄Ρ€Π΅Π²ΠΎΠ²ΠΈΠ΄Π½ΠΎΠ³ΠΎ Π³Ρ€Π°Ρ„Π°: ΠΌΠΎΠ΄Π΅Π»ΠΈ принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, которая ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅Ρ‚ ΠΈΡ… ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Π΅ послСдствия (с расчётом вСроятности наступлСния Ρ‚ΠΎΠ³ΠΎ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠ³ΠΎ события), ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ, Ρ€Π΅ΡΡƒΡ€ΡΠΎΠ·Π°Ρ‚Ρ€Π°Ρ‚Π½ΠΎΡΡ‚ΡŒ.

Для бизнСс-процСссов это Π΄Π΅Ρ€Π΅Π²ΠΎ складываСтся ΠΈΠ· минимального числа вопросов, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°ΡŽΡ‰ΠΈΡ… ΠΎΠ΄Π½ΠΎΠ·Π½Π°Ρ‡Π½Ρ‹ΠΉ ΠΎΡ‚Π²Π΅Ρ‚ β€” Β«Π΄Π°Β» ΠΈΠ»ΠΈ Β«Π½Π΅Ρ‚Β». ΠŸΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Π΄Π°Π² ΠΎΡ‚Π²Π΅Ρ‚Ρ‹ Π½Π° всС эти вопросы, ΠΌΡ‹ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΠΌ ΠΊ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΌΡƒ Π²Ρ‹Π±ΠΎΡ€Ρƒ. ΠœΠ΅Ρ‚ΠΎΠ΄ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ прСимущСства Π΄Π΅Ρ€Π΅Π²Π° принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ – Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½ΠΎ структурируСт ΠΈ систСматизируСт ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ, Π° ΠΈΡ‚ΠΎΠ³ΠΎΠ²ΠΎΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ принимаСтся Π½Π° основС логичСских Π²Ρ‹Π²ΠΎΠ΄ΠΎΠ².

2. Наивная байСсовская классификация

НаивныС байСсовскиС классификаторы относятся ΠΊ сСмСйству простых вСроятностных классификаторов ΠΈ Π±Π΅Ρ€ΡƒΡ‚ Π½Π°Ρ‡Π°Π»ΠΎ ΠΈΠ· Ρ‚Π΅ΠΎΡ€Π΅ΠΌΡ‹ БайСса, которая ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΊ Π΄Π°Π½Π½ΠΎΠΌΡƒ ΡΠ»ΡƒΡ‡Π°ΡŽ рассматриваСт Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ ΠΊΠ°ΠΊ нСзависимыС (это называСтся строгим, ΠΈΠ»ΠΈ Π½Π°ΠΈΠ²Π½Ρ‹ΠΌ, ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ΠΌ). На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… областях машинного обучСния:

ВсСм, ΠΊΡ‚ΠΎ Ρ…ΠΎΡ‚ΡŒ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ ΠΈΠ·ΡƒΡ‡Π°Π» статистику, Π·Π½Π°ΠΊΠΎΠΌΠΎ понятиС Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии. К Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Π°ΠΌ Π΅Ρ‘ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ относятся ΠΈ наимСньшиС ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Ρ‹. ΠžΠ±Ρ‹Ρ‡Π½ΠΎ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии Ρ€Π΅ΡˆΠ°ΡŽΡ‚ Π·Π°Π΄Π°Ρ‡ΠΈ ΠΏΠΎ ΠΏΠΎΠ΄Π³ΠΎΠ½ΠΊΠ΅ прямой, которая ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ Ρ‡Π΅Ρ€Π΅Π· мноТСство Ρ‚ΠΎΡ‡Π΅ΠΊ. Π’ΠΎΡ‚ ΠΊΠ°ΠΊ это дСлаСтся с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π½Π°ΠΈΠΌΠ΅Π½ΡŒΡˆΠΈΡ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ²: провСсти ΠΏΡ€ΡΠΌΡƒΡŽ, ΠΈΠ·ΠΌΠ΅Ρ€ΠΈΡ‚ΡŒ расстояниС ΠΎΡ‚ Π½Π΅Ρ‘ Π΄ΠΎ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· Ρ‚ΠΎΡ‡Π΅ΠΊ (Ρ‚ΠΎΡ‡ΠΊΠΈ ΠΈ линию ΡΠΎΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΎΡ‚Ρ€Π΅Π·ΠΊΠ°ΠΌΠΈ), ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ²ΡˆΡƒΡŽΡΡ сумму пСрСнСсти Π½Π°Π²Π΅Ρ€Ρ…. Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ Ρ‚Π° кривая, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ сумма расстояний Π±ΡƒΠ΄Π΅Ρ‚ наимСньшСй, ΠΈ Π΅ΡΡ‚ΡŒ искомая (эта линия ΠΏΡ€ΠΎΠΉΠ΄Ρ‘Ρ‚ Ρ‡Π΅Ρ€Π΅Π· Ρ‚ΠΎΡ‡ΠΊΠΈ с Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎ распрСдСлённым ΠΎΡ‚ΠΊΠ»ΠΎΠ½Π΅Π½ΠΈΠ΅ΠΌ ΠΎΡ‚ истинного значСния).

ЛинСйная функция ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΏΡ€ΠΈ ΠΏΠΎΠ΄Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… для машинного обучСния, Π° ΠΌΠ΅Ρ‚ΠΎΠ΄ Π½Π°ΠΈΠΌΠ΅Π½ΡŒΡˆΠΈΡ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ² – для свСдСния ΠΊ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌΡƒ ΠΏΠΎΠ³Ρ€Π΅ΡˆΠ½ΠΎΡΡ‚Π΅ΠΉ ΠΏΡƒΡ‚Π΅ΠΌ создания ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ошибок.

4. ЛогистичСская рСгрСссия

ЛогистичСская рСгрСссия – это способ опрСдСлСния зависимости ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΌΠΈ, ΠΎΠ΄Π½Π° ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½ΠΎ зависима, Π° Π΄Ρ€ΡƒΠ³ΠΈΠ΅ нСзависимы. Для этого примСняСтся логистичСская функция (аккумулятивноС логистичСскоС распрСдСлСниС). ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ логистичСской рСгрСссии Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΎΠ½Π° являСтся ΠΌΠΎΡ‰Π½Ρ‹ΠΌ статистичСским ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ прСдсказания событий, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Π² сСбя ΠΎΠ΄Π½Ρƒ ΠΈΠ»ΠΈ нСсколько нСзависимых ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…. Π­Ρ‚ΠΎ вострСбовано Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… ситуациях:

Π­Ρ‚ΠΎ Ρ†Π΅Π»Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Ρ… для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ‡ Π½Π° ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡŽ ΠΈ рСгрСссионный Π°Π½Π°Π»ΠΈΠ·. Π˜ΡΡ…ΠΎΠ΄Ρ ΠΈΠ· Ρ‚ΠΎΠ³ΠΎ Ρ‡Ρ‚ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚, находящийся Π² N-ΠΌΠ΅Ρ€Π½ΠΎΠΌ пространствС, относится ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· Π΄Π²ΡƒΡ… классов, ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² строит Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒ с ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒΡŽ (N – 1), Ρ‡Ρ‚ΠΎΠ±Ρ‹ всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ оказались Π² ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Π΄Π²ΡƒΡ… Π³Ρ€ΡƒΠΏΠΏ. На Π±ΡƒΠΌΠ°Π³Π΅ это ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°Π·ΠΈΡ‚ΡŒ Ρ‚Π°ΠΊ: Π΅ΡΡ‚ΡŒ Ρ‚ΠΎΡ‡ΠΊΠΈ Π΄Π²ΡƒΡ… Ρ€Π°Π·Π½Ρ‹Ρ… Π²ΠΈΠ΄ΠΎΠ², ΠΈ ΠΈΡ… ΠΌΠΎΠΆΠ½ΠΎ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ. ΠšΡ€ΠΎΠΌΠ΅ сСпарации Ρ‚ΠΎΡ‡Π΅ΠΊ, Π΄Π°Π½Π½Ρ‹ΠΉ ΠΌΠ΅Ρ‚ΠΎΠ΄ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½Π° Π±Ρ‹Π»Π° максимально ΡƒΠ΄Π°Π»Π΅Π½Π° ΠΎΡ‚ самой Π±Π»ΠΈΠ·ΠΊΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠΈ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π³Ρ€ΡƒΠΏΠΏΡ‹.

SVM ΠΈ Π΅Π³ΠΎ ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ ΠΏΠΎΠΌΠΎΠ³Π°ΡŽΡ‚ Ρ€Π΅ΡˆΠ°Ρ‚ΡŒ Ρ‚Π°ΠΊΠΈΠ΅ слоТныС Π·Π°Π΄Π°Ρ‡ΠΈ машинного обучСния, ΠΊΠ°ΠΊ сплайсинг Π”ΠΠš, ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΠΎΠ»Π° Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ° ΠΏΠΎ Ρ„ΠΎΡ‚ΠΎΠ³Ρ€Π°Ρ„ΠΈΠΈ, Π²Ρ‹Π²ΠΎΠ΄ Ρ€Π΅ΠΊΠ»Π°ΠΌΠ½Ρ‹Ρ… Π±Π°Π½Π½Π΅Ρ€ΠΎΠ² Π½Π° сайты.

Он базируСтся Π½Π° Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°Ρ… машинного обучСния, Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… мноТСство классификаторов ΠΈ Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‰ΠΈΡ… всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΈΠ· вновь ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‰ΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° основС ΠΈΡ… усрСднСния ΠΈΠ»ΠΈ ΠΈΡ‚ΠΎΠ³ΠΎΠ² голосования. Π˜Π·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎ ΠΌΠ΅Ρ‚ΠΎΠ΄ ансамблСй Π±Ρ‹Π» частным случаСм байСсовского усрСднСния, Π½ΠΎ Π·Π°Ρ‚Π΅ΠΌ услоТнился ΠΈ оброс Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ:

ΠšΠ»Π°ΡΡ‚Π΅Ρ€ΠΈΠ·Π°Ρ†ΠΈΡ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² распрСдСлСнии мноТСства ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΏΠΎ катСгориям Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π² ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΈ – кластСрС – оказались Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ схоТиС ΠΌΠ΅ΠΆΠ΄Ρƒ собой элСмСнты.

ΠšΠ»Π°ΡΡ‚Π΅Ρ€ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎ Ρ€Π°Π·Π½Ρ‹ΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌ. Π§Π°Ρ‰Π΅ всСго ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅:

8. ΠœΠ΅Ρ‚ΠΎΠ΄ Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ (PCA)

ΠœΠ΅Ρ‚ΠΎΠ΄ Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚, ΠΈΠ»ΠΈ PCA, прСдставляСт собой ΡΡ‚Π°Ρ‚ΠΈΡΡ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡŽ ΠΏΠΎ ΠΎΡ€Ρ‚ΠΎΠ³ΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠΌΡƒ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΡŽ, которая ΠΈΠΌΠ΅Π΅Ρ‚ своСй Ρ†Π΅Π»ΡŒΡŽ ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄ наблюдСний Π·Π° ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΌΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΊΠ°ΠΊ-Ρ‚ΠΎ взаимосвязаны ΠΌΠ΅ΠΆΠ΄Ρƒ собой, Π² Π½Π°Π±ΠΎΡ€ Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ – Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎ Π½Π΅ ΠΊΠΎΡ€Ρ€Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹.

ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ Π·Π°Π΄Π°Ρ‡ΠΈ, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… примСняСтся PCA, – визуализация ΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€ сТатия, упрощСния, ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ Π΄Π°Π½Π½Ρ‹Ρ… для Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ±Π»Π΅Π³Ρ‡ΠΈΡ‚ΡŒ процСсс обучСния. Однако ΠΌΠ΅Ρ‚ΠΎΠ΄ Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ Π½Π΅ годится для ситуаций, ΠΊΠΎΠ³Π΄Π° исходныС Π΄Π°Π½Π½Ρ‹Π΅ слабо упорядочСны (Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ всС ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΡƒΡŽΡ‚ΡΡ высокой диспСрсиСй). Π’Π°ΠΊ Ρ‡Ρ‚ΠΎ Π΅Π³ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΠΎΡΡ‚ΡŒ опрСдСляСтся Ρ‚Π΅ΠΌ, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΈΠ·ΡƒΡ‡Π΅Π½Π° ΠΈ описана прСдмСтная ΠΎΠ±Π»Π°ΡΡ‚ΡŒ.

9. БингулярноС Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅

Π’ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°Π»Π³Π΅Π±Ρ€Π΅ сингулярноС Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅, ΠΈΠ»ΠΈ SVD, опрСдСляСтся ΠΊΠ°ΠΊ Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΎΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹, состоящСй ΠΈΠ· комплСксных ΠΈΠ»ΠΈ вСщСствСнных чисСл. Π’Π°ΠΊ, ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ M Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒΡŽ [m*n] ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π»ΠΎΠΆΠΈΡ‚ΡŒ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎ M = UΞ£V, Π³Π΄Π΅ U ΠΈ V Π±ΡƒΠ΄ΡƒΡ‚ ΡƒΠ½ΠΈΡ‚Π°Ρ€Π½Ρ‹ΠΌΠΈ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π°ΠΌΠΈ, Π° Ξ£ – диагональной.

Одним ΠΈΠ· частных случаСв сингулярного разлоТСния являСтся ΠΌΠ΅Ρ‚ΠΎΠ΄ Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚. Π‘Π°ΠΌΡ‹Π΅ ΠΏΠ΅Ρ€Π²Ρ‹Π΅ Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½ΠΎΠ³ΠΎ зрСния Ρ€Π°Π·Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π»ΠΈΡΡŒ Π½Π° основС SVD ΠΈ PCA ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ: Π²Π½Π°Ρ‡Π°Π»Π΅ Π»ΠΈΡ†Π° (ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ прСдстояло Π½Π°ΠΉΡ‚ΠΈ) прСдставляли Π² Π²ΠΈΠ΄Π΅ суммы базисных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚, Π·Π°Ρ‚Π΅ΠΌ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π»ΠΈ ΠΈΡ… Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ, послС Ρ‡Π΅Π³ΠΎ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΠ»ΠΈ ΠΈΡ… сопоставлСниС с изобраТСниями ΠΈΠ· Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ. Π‘ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ сингулярного разлоТСния Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ, ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎ, Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ слоТнСС ΠΈ ΠΈΠ·ΠΎΡ‰Ρ€Ρ‘Π½Π½Π΅Π΅, Ρ‡Π΅ΠΌ ΠΈΡ… ΠΏΡ€Π΅Π΄ΡˆΠ΅ΡΡ‚Π²Π΅Π½Π½ΠΈΠΊΠΈ, Π½ΠΎ ΡΡƒΡ‚ΡŒ ΠΈΡ… Π² Ρ†Π΅Π»ΠΎΠΌ Π½Π΅ΠΌ измСнилась.

10. Анализ нСзависимых ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ (ICA)

Π­Ρ‚ΠΎ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· статистичСских ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ выявляСт скрытыС Ρ„Π°ΠΊΡ‚ΠΎΡ€Ρ‹, ΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‰ΠΈΠ΅ влияниС Π½Π° случайныС Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹, сигналы ΠΈ ΠΏΡ€. ICA Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΠ΅Ρ‚ ΠΏΠΎΡ€ΠΎΠΆΠ΄Π°ΡŽΡ‰ΡƒΡŽ модСль для Π±Π°Π· ΠΌΠ½ΠΎΠ³ΠΎΡ„Π°ΠΊΡ‚ΠΎΡ€Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. ΠŸΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ Π² ΠΌΠΎΠ΄Π΅Π»ΠΈ содСрТат Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ скрытыС ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅, ΠΏΡ€ΠΈΡ‡Π΅ΠΌ Π½Π΅Ρ‚ Π½ΠΈΠΊΠ°ΠΊΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΎ ΠΏΡ€Π°Π²ΠΈΠ»Π°Ρ… ΠΈΡ… смСшивания. Π­Ρ‚ΠΈ скрытыС ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ нСзависимыми ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Π°ΠΌΠΈ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ ΠΈ ΡΡ‡ΠΈΡ‚Π°ΡŽΡ‚ΡΡ нСгауссовскими сигналами.

Π’ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ Π°Π½Π°Π»ΠΈΠ·Π° Π³Π»Π°Π²Π½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ связан с Π΄Π°Π½Π½Ρ‹ΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ, Π°Π½Π°Π»ΠΈΠ· нСзависимых ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ Π±ΠΎΠ»Π΅Π΅ эффСктивСн, особСнно Π² Ρ‚Π΅Ρ… случаях, ΠΊΠΎΠ³Π΄Π° классичСскиС ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρ‹ ΠΎΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ Π±Π΅ΡΡΠΈΠ»ΡŒΠ½Ρ‹. Он ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ скрытыС ΠΏΡ€ΠΈΡ‡ΠΈΠ½Ρ‹ явлСний ΠΈ благодаря этому Π½Π°ΡˆΡ‘Π» ΡˆΠΈΡ€ΠΎΠΊΠΎΠ΅ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π² самых Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… областях – ΠΎΡ‚ астрономии ΠΈ ΠΌΠ΅Π΄ΠΈΡ†ΠΈΠ½Ρ‹ Π΄ΠΎ распознавания Ρ€Π΅Ρ‡ΠΈ, автоматичСского тСстирования ΠΈ Π°Π½Π°Π»ΠΈΠ·Π° Π΄ΠΈΠ½Π°ΠΌΠΈΠΊΠΈ финансовых ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ.

1.5 ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ примСнСния Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΆΠΈΠ·Π½ΠΈ

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ 1. Диагностика Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠΉ

ΠŸΠ°Ρ†ΠΈΠ΅Π½Ρ‚Ρ‹ Π² Π΄Π°Π½Π½ΠΎΠΌ случаС ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ, Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌΠΈ – всС Π½Π°Π±Π»ΡŽΠ΄Π°ΡŽΡ‰ΠΈΠ΅ΡΡ Ρƒ Π½ΠΈΡ… симптомы, Π°Π½Π°ΠΌΠ½Π΅Π·, Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π°Π½Π°Π»ΠΈΠ·ΠΎΠ², ΡƒΠΆΠ΅ прСдпринятыС Π»Π΅Ρ‡Π΅Π±Π½Ρ‹Π΅ ΠΌΠ΅Ρ€Ρ‹ (фактичСски вся история Π±ΠΎΠ»Π΅Π·Π½ΠΈ, формализованная ΠΈ разбитая Π½Π° ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΈ). НСкоторыС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ – ΠΏΠΎΠ», Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ ΠΈΠ»ΠΈ отсутствиС Π³ΠΎΠ»ΠΎΠ²Π½ΠΎΠΉ Π±ΠΎΠ»ΠΈ, кашля, сыпи ΠΈ ΠΈΠ½Ρ‹Π΅ – Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡ ΠΊΠ°ΠΊ Π±ΠΈΠ½Π°Ρ€Π½Ρ‹Π΅. ΠžΡ†Π΅Π½ΠΊΠ° тяТСсти состояния (ΠΊΡ€Π°ΠΉΠ½Π΅ тяТёлоС, срСднСй тяТСсти ΠΈ Π΄Ρ€.) являСтся порядковым ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠΌ, Π° ΠΌΠ½ΠΎΠ³ΠΈΠ΅ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ – количСствСнными: ΠΎΠ±ΡŠΡ‘ΠΌ лСкарствСнного ΠΏΡ€Π΅ΠΏΠ°Ρ€Π°Ρ‚Π°, ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ Π³Π΅ΠΌΠΎΠ³Π»ΠΎΠ±ΠΈΠ½Π° Π² ΠΊΡ€ΠΎΠ²ΠΈ, ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ Π°Ρ€Ρ‚Π΅Ρ€ΠΈΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ давлСния ΠΈ ΠΏΡƒΠ»ΡŒΡΠ°, возраст, вСс. Π‘ΠΎΠ±Ρ€Π°Π² ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎ состоянии ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚Π°, ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‰ΡƒΡŽ ΠΌΠ½ΠΎΠ³ΠΎ Ρ‚Π°ΠΊΠΈΡ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΌΠΎΠΆΠ½ΠΎ Π·Π°Π³Ρ€ΡƒΠ·ΠΈΡ‚ΡŒ Π΅Ρ‘ Π² ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡ‹, способной ΠΊ ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠΌΡƒ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΡŽ, Ρ€Π΅ΡˆΠΈΡ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ Π·Π°Π΄Π°Ρ‡ΠΈ:

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ 2. Поиск мСст залСгания ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… ископаСмых

Π’ Ρ€ΠΎΠ»ΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² здСсь Π²Ρ‹ΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ свСдСния, Π΄ΠΎΠ±Ρ‹Ρ‚Ρ‹Π΅ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ гСологичСской Ρ€Π°Π·Π²Π΅Π΄ΠΊΠΈ: Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Π½Π° Ρ‚Π΅Ρ€Ρ€ΠΈΡ‚ΠΎΡ€ΠΈΠΈ мСстности ΠΊΠ°ΠΊΠΈΡ…-Π»ΠΈΠ±ΠΎ ΠΏΠΎΡ€ΠΎΠ΄ (ΠΈ это Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠΌ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ³ΠΎ Ρ‚ΠΈΠΏΠ°), ΠΈΡ… физичСскиС ΠΈ химичСскиС свойства (ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π°ΡΠΊΠ»Π°Π΄Ρ‹Π²Π°ΡŽΡ‚ΡΡ Π½Π° ряд количСствСнных ΠΈ качСствСнных ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²).

Для ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰Π΅ΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ бСрутся 2 Π²ΠΈΠ΄Π° ΠΏΡ€Π΅Ρ†Π΅Π΄Π΅Π½Ρ‚ΠΎΠ²: Ρ€Π°ΠΉΠΎΠ½Ρ‹, Π³Π΄Π΅ Ρ‚ΠΎΡ‡Π½ΠΎ ΠΏΡ€ΠΈΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚ мСстороТдСния ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… ископаСмых, ΠΈ Ρ€Π°ΠΉΠΎΠ½Ρ‹ с ΠΏΠΎΡ…ΠΎΠΆΠΈΠΌΠΈ характСристиками, Π³Π΄Π΅ эти ископаСмыС Π½Π΅ Π±Ρ‹Π»ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½Ρ‹. Но Π΄ΠΎΠ±Ρ‹Ρ‡Π° Ρ€Π΅Π΄ΠΊΠΈΡ… ΠΏΠΎΠ»Π΅Π·Π½Ρ‹Ρ… ископаСмых ΠΈΠΌΠ΅Π΅Ρ‚ свою спСцифику: Π²ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΡ… случаях количСство ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ°Π΅Ρ‚ число ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Ρ‚Ρ€Π°Π΄ΠΈΡ†ΠΈΠΎΠ½Π½ΠΎΠΉ статистики ΠΏΠ»ΠΎΡ…ΠΎ подходят для Ρ‚Π°ΠΊΠΈΡ… ситуаций. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ ΠΏΡ€ΠΈ машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ Π°ΠΊΡ†Π΅Π½Ρ‚ дСлаСтся Π½Π° ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ закономСрностСй Π² ΡƒΠΆΠ΅ собранном массивС Π΄Π°Π½Π½Ρ‹Ρ…. Для этого ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ΡΡ нСбольшиС ΠΈ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½Ρ‹Π΅ совокупности ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ максимально ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ для ΠΎΡ‚Π²Π΅Ρ‚Π° Π½Π° вопрос исслСдования – Π΅ΡΡ‚ΡŒ Π² ΡƒΠΊΠ°Π·Π°Π½Π½ΠΎΠΉ мСстности Ρ‚ΠΎ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠ΅ ископаСмоС ΠΈΠ»ΠΈ Π½Π΅Ρ‚. МоТно провСсти аналогию с ΠΌΠ΅Π΄ΠΈΡ†ΠΈΠ½ΠΎΠΉ: Ρƒ мСстороТдСний Ρ‚ΠΎΠΆΠ΅ ΠΌΠΎΠΆΠ½ΠΎ Π²Ρ‹ΡΠ²ΠΈΡ‚ΡŒ свои синдромы. Π¦Π΅Π½Π½ΠΎΡΡ‚ΡŒ примСнСния машинного обучСния Π² этой области Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ носят практичСский Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€, Π½ΠΎ ΠΈ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ ΡΠ΅Ρ€ΡŒΡ‘Π·Π½Ρ‹ΠΉ Π½Π°ΡƒΡ‡Π½Ρ‹ΠΉ интСрСс для Π³Π΅ΠΎΠ»ΠΎΠ³ΠΎΠ² ΠΈ Π³Π΅ΠΎΡ„ΠΈΠ·ΠΈΠΊΠΎΠ².

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ 3. ΠžΡ†Π΅Π½ΠΊΠ° надёТности ΠΈ платёТСспособности ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ² Π½Π° ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΊΡ€Π΅Π΄ΠΈΡ‚ΠΎΠ²

Π‘ этой Π·Π°Π΄Π°Ρ‡Π΅ΠΉ Π΅ΠΆΠ΅Π΄Π½Π΅Π²Π½ΠΎ ΡΡ‚Π°Π»ΠΊΠΈΠ²Π°ΡŽΡ‚ΡΡ всС Π±Π°Π½ΠΊΠΈ, Π·Π°Π½ΠΈΠΌΠ°ΡŽΡ‰ΠΈΠ΅ΡΡ Π²Ρ‹Π΄Π°Ρ‡Π΅ΠΉ ΠΊΡ€Π΅Π΄ΠΈΡ‚ΠΎΠ². ΠΠ΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒ Π² Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·Π°Ρ†ΠΈΠΈ этого процСсса Π½Π°Π·Ρ€Π΅Π»Π° Π΄Π°Π²Π½ΠΎ, Π΅Ρ‰Ρ‘ Π² 1960–1970-Π΅ Π³ΠΎΠ΄Ρ‹, ΠΊΠΎΠ³Π΄Π° Π² БША ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΡ… странах начался Π±ΡƒΠΌ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹Ρ… ΠΊΠ°Ρ€Ρ‚.

Π›ΠΈΡ†Π°, Π·Π°ΠΏΡ€Π°ΡˆΠΈΠ²Π°ΡŽΡ‰ΠΈΠ΅ Ρƒ Π±Π°Π½ΠΊΠ° Π·Π°Ρ‘ΠΌ, – это ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹, Π° Π²ΠΎΡ‚ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ Π±ΡƒΠ΄ΡƒΡ‚ ΠΎΡ‚Π»ΠΈΡ‡Π°Ρ‚ΡŒΡΡ Π² зависимости ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ, физичСскоС это Π»ΠΈΡ†ΠΎ ΠΈΠ»ΠΈ ΡŽΡ€ΠΈΠ΄ΠΈΡ‡Π΅ΡΠΊΠΎΠ΅. ΠŸΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²ΠΎΠ΅ описаниС частного Π»ΠΈΡ†Π°, ΠΏΡ€Π΅Ρ‚Π΅Π½Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ Π½Π° ΠΊΡ€Π΅Π΄ΠΈΡ‚, формируСтся Π½Π° основС Π΄Π°Π½Π½Ρ‹Ρ… Π°Π½ΠΊΠ΅Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΎΠ½ΠΎ заполняСт. Π—Π°Ρ‚Π΅ΠΌ Π°Π½ΠΊΠ΅Ρ‚Π° дополняСтся Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ свСдСниями ΠΎ ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΌ ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π΅, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±Π°Π½ΠΊ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ ΠΏΠΎ своим ΠΊΠ°Π½Π°Π»Π°ΠΌ. Π§Π°ΡΡ‚ΡŒ ΠΈΠ· Π½ΠΈΡ… относятся ΠΊ Π±ΠΈΠ½Π°Ρ€Π½Ρ‹ΠΌ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ (ΠΏΠΎΠ», Π½Π°Π»ΠΈΡ‡ΠΈΠ΅ Ρ‚Π΅Π»Π΅Ρ„ΠΎΠ½Π½ΠΎΠ³ΠΎ Π½ΠΎΠΌΠ΅Ρ€Π°), Π΄Ρ€ΡƒΠ³ΠΈΠ΅ β€” ΠΊ порядковым (ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅, Π΄ΠΎΠ»ΠΆΠ½ΠΎΡΡ‚ΡŒ), Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ ΠΆΠ΅ ΡΠ²Π»ΡΡŽΡ‚ΡΡ количСствСнными (Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Π° Π·Π°ΠΉΠΌΠ°, общая сумма задолТСнностСй ΠΏΠΎ Π΄Ρ€ΡƒΠ³ΠΈΠΌ Π±Π°Π½ΠΊΠ°ΠΌ, возраст, количСство Ρ‡Π»Π΅Π½ΠΎΠ² сСмьи, Π΄ΠΎΡ…ΠΎΠ΄, Ρ‚Ρ€ΡƒΠ΄ΠΎΠ²ΠΎΠΉ стаТ) ΠΈΠ»ΠΈ Π½ΠΎΠΌΠΈΠ½Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ (имя, Π½Π°Π·Π²Π°Π½ΠΈΠ΅ Ρ„ΠΈΡ€ΠΌΡ‹-работодатСля, профСссия, адрСс).

Для машинного обучСния составляСтся Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°, Π² ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ входят ΠΊΡ€Π΅Π΄ΠΈΡ‚ΠΎΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚Π΅Π»ΠΈ, Ρ‡ΡŒΡ крСдитная история извСстна. ВсС Π·Π°Ρ‘ΠΌΡ‰ΠΈΠΊΠΈ дСлятся Π½Π° классы, Π² ΠΏΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠ΅ΠΌ случаС ΠΈΡ… 2 – Β«Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅Β» Π·Π°Ρ‘ΠΌΡ‰ΠΈΠΊΠΈ ΠΈ Β«ΠΏΠ»ΠΎΡ…ΠΈΠ΅Β», ΠΈ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ ΠΎ Π²Ρ‹Π΄Π°Ρ‡Π΅ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π° принимаСтся Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π² ΠΏΠΎΠ»ΡŒΠ·Ρƒ Β«Ρ…ΠΎΡ€ΠΎΡˆΠΈΡ…Β».

Π‘ΠΎΠ»Π΅Π΅ слоТный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ машинного обучСния, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΉ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΌ скорингом, прСдусматриваСт начислСниС ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ Π·Π°Ρ‘ΠΌΡ‰ΠΈΠΊΡƒ условных Π±Π°Π»Π»ΠΎΠ² Π·Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊ, ΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ ΠΎ прСдоставлСнии ΠΊΡ€Π΅Π΄ΠΈΡ‚Π° Π±ΡƒΠ΄Π΅Ρ‚ Π·Π°Π²ΠΈΡΠ΅Ρ‚ΡŒ ΠΎΡ‚ суммы Π½Π°Π±Ρ€Π°Π½Π½Ρ‹Ρ… Π±Π°Π»Π»ΠΎΠ². Π’ΠΎ врСмя машинного обучСния систСмы ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½ΠΎΠ³ΠΎ скоринга Π²Π½Π°Ρ‡Π°Π»Π΅ Π½Π°Π·Π½Π°Ρ‡Π°ΡŽΡ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ количСство Π±Π°Π»Π»ΠΎΠ² ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΡƒ, Π° Π·Π°Ρ‚Π΅ΠΌ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ условия Π²Ρ‹Π΄Π°Ρ‡ΠΈ Π·Π°ΠΉΠΌΠ° (срок, ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚Π½ΡƒΡŽ ставку ΠΈ ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΡ‚Ρ€Π°ΠΆΠ°ΡŽΡ‚ΡΡ Π² ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½ΠΎΠΌ Π΄ΠΎΠ³ΠΎΠ²ΠΎΡ€Π΅). Но сущСствуСт Ρ‚Π°ΠΊΠΆΠ΅ ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ обучСния систСмы – Π½Π° основС ΠΏΡ€Π΅Ρ†Π΅Π΄Π΅Π½Ρ‚ΠΎΠ².

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ΠžΠ±Π·ΠΎΡ€ самых популярных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния

ΠΠ²Ρ‚ΠΎΡ€ΠΈΠ·ΡƒΠΉΡ‚Π΅ΡΡŒ

ΠžΠ±Π·ΠΎΡ€ самых популярных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

БущСствуСт Ρ‚Π°ΠΊΠΎΠ΅ понятиС, ΠΊΠ°ΠΊ Β«No Free LunchΒ» Ρ‚Π΅ΠΎΡ€Π΅ΠΌΠ°. Π•Ρ‘ ΡΡƒΡ‚ΡŒ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π½Π΅Ρ‚ Ρ‚Π°ΠΊΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π±Ρ‹Π» Π±Ρ‹ Π»ΡƒΡ‡ΡˆΠΈΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΎΠΌ для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π·Π°Π΄Π°Ρ‡ΠΈ, Ρ‡Ρ‚ΠΎ Π² особСнности касаСтся обучСния с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ.

НапримСр, нСльзя ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти всСгда Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ Π»ΡƒΡ‡ΡˆΠ΅, Ρ‡Π΅ΠΌ Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, ΠΈ Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚. На ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² влияСт мноТСство Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ² Π²Ρ€ΠΎΠ΄Π΅ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΈ структуры Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ….

По этой ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π΅ приходится ΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠ½ΠΎΠ³ΠΎ Ρ€Π°Π·Π½Ρ‹Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², провСряя ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π½Π° тСстовом Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈ Π·Π°Ρ‚Π΅ΠΌ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠΈΠΉ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚. Π‘Π°ΠΌΠΎ собой, Π½ΡƒΠΆΠ½ΠΎ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ срСди Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… вашСй Π·Π°Π΄Π°Ρ‡Π΅. Если ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ аналогию, Ρ‚ΠΎ ΠΏΡ€ΠΈ ΡƒΠ±ΠΎΡ€ΠΊΠ΅ Π΄ΠΎΠΌΠ° Π²Ρ‹, скорСС всСго, Π±ΡƒΠ΄Π΅Ρ‚Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ пылСсос, ΠΌΠ΅Ρ‚Π»Ρƒ ΠΈΠ»ΠΈ ΡˆΠ²Π°Π±Ρ€Ρƒ, Π½ΠΎ Π½ΠΈΠΊΠ°ΠΊ Π½Π΅ Π»ΠΎΠΏΠ°Ρ‚Ρƒ.

18–20 ноября, Онлайн, Π‘Π΅cΠΏΠ»Π°Ρ‚Π½ΠΎ

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΠ΅ΠΌ Π²Π°ΡˆΠ΅ΠΌΡƒ вниманию ΠΊΡ€Π°Ρ‚ΠΊΠΈΠΉ ΠΎΠ±Π·ΠΎΡ€ Ρ‚ΠΎΠΏ-10 популярных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ.

1. ЛинСйная рСгрСссия

ЛинСйная рСгрСссия β€” ΠΏΠΎΠΆΠ°Π»ΡƒΠΉ, ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ извСстных ΠΈ понятных Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² Π² статистикС ΠΈ машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ.

ΠŸΡ€ΠΎΠ³Π½ΠΎΡΡ‚ΠΈΡ‡Π΅ΡΠΊΠΎΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Π² ΠΏΠ΅Ρ€Π²ΡƒΡŽ ΠΎΡ‡Π΅Ρ€Π΅Π΄ΡŒ касаСтся ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ ошибки ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΠ»ΠΈ, Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ словами, ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½ΠΎΠ³ΠΎ прогнозирования. ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ Π·Π°ΠΈΠΌΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΈΠ· Ρ€Π°Π·Π½Ρ‹Ρ… областСй, Π²ΠΊΠ»ΡŽΡ‡Π°Ρ статистику, ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ… Π² этих цСлях.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

НапримСр: Y = B0 + B1 * X

Для ΠΎΡ†Π΅Π½ΠΊΠΈ рСгрСссионной ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Π²Ρ€ΠΎΠ΄Π΅ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°Π»Π³Π΅Π±Ρ€Ρ‹ ΠΈΠ»ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π½Π°ΠΈΠΌΠ΅Π½ΡŒΡˆΠΈΡ… ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ΠΎΠ².

ЛинСйная рСгрСссия сущСствуСт ΡƒΠΆΠ΅ Π±ΠΎΠ»Π΅Π΅ 200 Π»Π΅Ρ‚, ΠΈ Π·Π° это врСмя Π΅Ρ‘ успСли Ρ‚Ρ‰Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈΠ·ΡƒΡ‡ΠΈΡ‚ΡŒ. Π’Π°ΠΊ Ρ‡Ρ‚ΠΎ Π²ΠΎΡ‚ ΠΏΠ°Ρ€Π° практичСских ΠΏΡ€Π°Π²ΠΈΠ»: ΡƒΠ±Π΅Ρ€ΠΈΡ‚Π΅ ΠΏΠΎΡ…ΠΎΠΆΠΈΠ΅ (ΠΊΠΎΡ€Ρ€Π΅Π»ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅) ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ ΠΈ ΠΈΠ·Π±Π°Π²ΡŒΡ‚Π΅ΡΡŒ ΠΎΡ‚ ΡˆΡƒΠΌΠ° Π² Π΄Π°Π½Π½Ρ‹Ρ…, Ссли это Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ. ЛинСйная рСгрСссия β€” быстрый ΠΈ простой Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ Π² качСствС ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° для изучСния.

ЛогистичСская рСгрСссия β€” Π΅Ρ‰Ρ‘ ΠΎΠ΄ΠΈΠ½ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΏΡ€ΠΈΡˆΠ΅Π΄ΡˆΠΈΠΉ Π² машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ прямиком ΠΈΠ· статистики. Π•Ρ‘ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для Π·Π°Π΄Π°Ρ‡ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации (это Π·Π°Π΄Π°Ρ‡ΠΈ, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π΄Π²ΡƒΡ… классов).

ЛогистичСская рСгрСссия ΠΏΠΎΡ…ΠΎΠΆΠ° Π½Π° Π»ΠΈΠ½Π΅ΠΉΠ½ΡƒΡŽ Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ Π² Π½Π΅ΠΉ Ρ‚ΠΎΠΆΠ΅ трСбуСтся Π½Π°ΠΉΡ‚ΠΈ значСния коэффициСнтов для Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…. Π Π°Π·Π½ΠΈΡ†Π° Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ прСобразуСтся с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ ΠΈΠ»ΠΈ логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ.

ЛогистичСская функция выглядит ΠΊΠ°ΠΊ большая Π±ΡƒΠΊΠ²Π° S ΠΈ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Ρ‹Π²Π°Π΅Ρ‚ любоС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π² число Π² ΠΏΡ€Π΅Π΄Π΅Π»Π°Ρ… ΠΎΡ‚ 0 Π΄ΠΎ 1. Π­Ρ‚ΠΎ вСсьма ΠΏΠΎΠ»Π΅Π·Π½ΠΎ, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ ΠΊ Π²Ρ‹Ρ…ΠΎΠ΄Ρƒ логистичСской Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ для привязки ΠΊ 0 ΠΈ 1 (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ссли Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ мСньшС 0.5, Ρ‚ΠΎ Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ 1) ΠΈ прСдсказания класса.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Благодаря Ρ‚ΠΎΠΌΡƒ, ΠΊΠ°ΠΊ обучаСтся модСль, прСдсказания логистичСской рСгрСссии ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для отобраТСния вСроятности принадлСТности ΠΎΠ±Ρ€Π°Π·Ρ†Π° ΠΊ классу 0 ΠΈΠ»ΠΈ 1. Π­Ρ‚ΠΎ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ Π² Ρ‚Π΅Ρ… случаях, ΠΊΠΎΠ³Π΄Π° Π½ΡƒΠΆΠ½ΠΎ ΠΈΠΌΠ΅Ρ‚ΡŒ большС обоснований для прогнозирования.

Как ΠΈ Π² случаС с Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссиСй, логистичСская рСгрСссия выполняСт свою Π·Π°Π΄Π°Ρ‡Ρƒ Π»ΡƒΡ‡ΡˆΠ΅, Ссли ΡƒΠ±Ρ€Π°Ρ‚ΡŒ лишниС ΠΈ ΠΏΠΎΡ…ΠΎΠΆΠΈΠ΅ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅. МодСль логистичСской рСгрСссии быстро обучаСтся ΠΈ Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для Π·Π°Π΄Π°Ρ‡ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации.

3. Π›ΠΈΠ½Π΅ΠΉΠ½Ρ‹ΠΉ дискриминантный Π°Π½Π°Π»ΠΈΠ· (LDA)

ЛогистичСская рСгрСссия ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ, ΠΊΠΎΠ³Π΄Π° Π½ΡƒΠΆΠ½ΠΎ отнСсти ΠΎΠ±Ρ€Π°Π·Π΅Ρ† ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· Π΄Π²ΡƒΡ… классов. Если классов большС, Ρ‡Π΅ΠΌ Π΄Π²Π°, Ρ‚ΠΎ Π»ΡƒΡ‡ΡˆΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ LDA (Linear discriminant analysis).

ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½ΠΈΠ΅ LDA довольно простоС. Оно состоит ΠΈΠ· статистичСских свойств Π΄Π°Π½Π½Ρ‹Ρ…, рассчитанных для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса. Для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π²Ρ…ΠΎΠ΄Π½ΠΎΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ это Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚:

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡ производятся ΠΏΡƒΡ‚Ρ‘ΠΌ вычислСния дискриминантного значСния для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса ΠΈ Π²Ρ‹Π±ΠΎΡ€Π° класса с наибольшим Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ. ΠŸΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚ΡΡ, Ρ‡Ρ‚ΠΎ Π΄Π°Π½Π½Ρ‹Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ распрСдСлСниС, поэтому ΠΏΠ΅Ρ€Π΅Π΄ Π½Π°Ρ‡Π°Π»ΠΎΠΌ Ρ€Π°Π±ΠΎΡ‚Ρ‹ рСкомСндуСтся ΡƒΠ΄Π°Π»ΠΈΡ‚ΡŒ ΠΈΠ· Π΄Π°Π½Π½Ρ‹Ρ… Π°Π½ΠΎΠΌΠ°Π»ΡŒΠ½Ρ‹Π΅ значСния. Π­Ρ‚ΠΎ простой ΠΈ эффСктивный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ для Π·Π°Π΄Π°Ρ‡ классификации.

4. Π”Π΅Ρ€Π΅Π²ΡŒΡ принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ

Π”Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π² Π²ΠΈΠ΄Π΅ Π΄Π²ΠΎΠΈΡ‡Π½ΠΎΠ³ΠΎ Π΄Π΅Ρ€Π΅Π²Π°, Π·Π½Π°ΠΊΠΎΠΌΠΎΠ³ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΠΌ ΠΏΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌ ΠΈ структурам Π΄Π°Π½Π½Ρ‹Ρ…. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ ΡƒΠ·Π΅Π» прСдставляСт собой Π²Ρ…ΠΎΠ΄Π½ΡƒΡŽ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ ΠΈ Ρ‚ΠΎΡ‡ΠΊΡƒ раздСлСния для этой ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ (ΠΏΡ€ΠΈ условии, Ρ‡Ρ‚ΠΎ пСрСмСнная β€” число).

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

ЛистовыС ΡƒΠ·Π»Ρ‹ β€” это выходная пСрСмСнная, которая ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для прСдсказания. ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΡ производятся ΠΏΡƒΡ‚Ρ‘ΠΌ ΠΏΡ€ΠΎΡ…ΠΎΠ΄Π° ΠΏΠΎ Π΄Π΅Ρ€Π΅Π²Ρƒ ΠΊ листовому ΡƒΠ·Π»Ρƒ ΠΈ Π²Ρ‹Π²ΠΎΠ΄Π° значСния класса Π½Π° этом ΡƒΠ·Π»Π΅.

Π”Π΅Ρ€Π΅Π²ΡŒΡ быстро ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ΡΡ ΠΈ Π΄Π΅Π»Π°ΡŽΡ‚ прСдсказания. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΎΠ½ΠΈ Ρ‚ΠΎΡ‡Π½Ρ‹ для ΡˆΠΈΡ€ΠΎΠΊΠΎΠ³ΠΎ ΠΊΡ€ΡƒΠ³Π° Π·Π°Π΄Π°Ρ‡ ΠΈ Π½Π΅ Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ особой ΠΏΠΎΠ΄Π³ΠΎΡ‚ΠΎΠ²ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ….

Наивный БайСс β€” простой, Π½ΠΎ ΡƒΠ΄ΠΈΠ²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ эффСктивный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ.

МодСль состоит ΠΈΠ· Π΄Π²ΡƒΡ… Ρ‚ΠΈΠΏΠΎΠ² вСроятностСй, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π°ΡΡΡ‡ΠΈΡ‚Ρ‹Π²Π°ΡŽΡ‚ΡΡ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…:

ПослС расчёта вСроятностной ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΅Ρ‘ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для прСдсказания с Π½ΠΎΠ²Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Ρ‚Π΅ΠΎΡ€Π΅ΠΌΡ‹ БайСса. Если Ρƒ вас вСщСствСнныС Π΄Π°Π½Π½Ρ‹Π΅, Ρ‚ΠΎ, прСдполагая Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎΠ΅ распрСдСлСниС, Ρ€Π°ΡΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ эти вСроятности Π½Π΅ составляСт особой слоТности.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Наивный БайСс называСтся Π½Π°ΠΈΠ²Π½Ρ‹ΠΌ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ каТдая входная пСрСмСнная нСзависимая. Π­Ρ‚ΠΎ сильноС ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π½Π΅ соотвСтствуСт Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ. Π’Π΅ΠΌ Π½Π΅ ΠΌΠ΅Π½Π΅Π΅ Π΄Π°Π½Π½Ρ‹ΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ вСсьма эффСктивСн для Ρ†Π΅Π»ΠΎΠ³ΠΎ ряда слоТных Π·Π°Π΄Π°Ρ‡ Π²Ρ€ΠΎΠ΄Π΅ классификации спама ΠΈΠ»ΠΈ распознавания рукописных Ρ†ΠΈΡ„Ρ€.

6. K-Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй (KNN)

К-Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй β€” ΠΎΡ‡Π΅Π½ΡŒ простой ΠΈ ΠΎΡ‡Π΅Π½ΡŒ эффСктивный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ. МодСль KNN (K-nearest neighbors) прСдставлСна всСм Π½Π°Π±ΠΎΡ€ΠΎΠΌ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. Π”ΠΎΠ²ΠΎΠ»ΡŒΠ½ΠΎ просто, Π½Π΅ Ρ‚Π°ΠΊ Π»ΠΈ?

ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Π½ΠΈΠ΅ для Π½ΠΎΠ²ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠΈ дСлаСтся ΠΏΡƒΡ‚Ρ‘ΠΌ поиска K Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй Π² Π½Π°Π±ΠΎΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ суммирования Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ для этих K экзСмпляров.

Вопрос лишь Π² Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ сходство ΠΌΠ΅ΠΆΠ΄Ρƒ экзСмплярами Π΄Π°Π½Π½Ρ‹Ρ…. Если всС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΠ΄ΠΈΠ½ ΠΈ Ρ‚ΠΎΡ‚ ΠΆΠ΅ ΠΌΠ°ΡΡˆΡ‚Π°Π± (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, сантимСтры), Ρ‚ΠΎ самый простой способ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² использовании Π΅Π²ΠΊΠ»ΠΈΠ΄ΠΎΠ²Π° расстояния β€” числа, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°ΡΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π½Π° основС Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΠΉ с ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π²Ρ…ΠΎΠ΄Π½ΠΎΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

KNN ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠ½ΠΎΠ³ΠΎ памяти для хранСния всСх Π΄Π°Π½Π½Ρ‹Ρ…, Π½ΠΎ Π·Π°Ρ‚ΠΎ быстро сдСлаСт прСдсказаниС. Π’Π°ΠΊΠΆΠ΅ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ прСдсказания ΠΎΡΡ‚Π°Π²Π°Π»ΠΈΡΡŒ Ρ‚ΠΎΡ‡Π½Ρ‹ΠΌΠΈ с Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ.

ИдСя Π±Π»ΠΈΠΆΠ°ΠΉΡˆΠΈΡ… сосСдСй ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠ»ΠΎΡ…ΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с ΠΌΠ½ΠΎΠ³ΠΎΠΌΠ΅Ρ€Π½Ρ‹ΠΌΠΈ Π΄Π°Π½Π½Ρ‹ΠΌΠΈ (мноТСство Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…), Ρ‡Ρ‚ΠΎ Π½Π΅Π³Π°Ρ‚ΠΈΠ²Π½ΠΎ скаТСтся Π½Π° эффСктивности Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° ΠΏΡ€ΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΈ Π·Π°Π΄Π°Ρ‡ΠΈ. Π­Ρ‚ΠΎ называСтся проклятиСм размСрности. Π˜Π½Ρ‹ΠΌΠΈ словами, стоит ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ лишь Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Π²Π°ΠΆΠ½Ρ‹Π΅ для прСдсказания ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅.

НСдостаток KNN Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π½ΡƒΠΆΠ½ΠΎ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ вСсь Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…. Если KNN Ρ…ΠΎΡ€ΠΎΡˆΠΎ сСбя ΠΏΠΎΠΊΠ°Π·Π°Π», Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ смысл ΠΏΠΎΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ LVQ (Learning vector quantization), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π»ΠΈΡˆΡ‘Π½ этого нСдостатка.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

LVQ прСдставляСт собой Π½Π°Π±ΠΎΡ€ ΠΊΠΎΠ΄ΠΎΠ²Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ². Они Π²Ρ‹Π±ΠΈΡ€Π°ΡŽΡ‚ΡΡ Π² Π½Π°Ρ‡Π°Π»Π΅ случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΈ Π² Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Ρ‘Π½Π½ΠΎΠ³ΠΎ количСства ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΉ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΡƒΡŽΡ‚ΡΡ Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΎΠ±ΠΎΠ±Ρ‰ΠΈΡ‚ΡŒ вСсь Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…. ПослС обучСния эти Π²Π΅ΠΊΡ‚ΠΎΡ€Π° ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для прСдсказания Ρ‚Π°ΠΊ ΠΆΠ΅, ΠΊΠ°ΠΊ это дСлаСтся Π² KNN. Алгоритм ΠΈΡ‰Π΅Ρ‚ блиТайшСго сосСда (Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ подходящий ΠΊΠΎΠ΄ΠΎΠ²Ρ‹ΠΉ Π²Π΅ΠΊΡ‚ΠΎΡ€) ΠΏΡƒΡ‚Ρ‘ΠΌ вычислСния расстояния ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΌ ΠΊΠΎΠ΄ΠΎΠ²Ρ‹ΠΌ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠΌ ΠΈ Π½ΠΎΠ²Ρ‹ΠΌ экзСмпляром Π΄Π°Π½Π½Ρ‹Ρ…. Π—Π°Ρ‚Π΅ΠΌ для Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ подходящСго Π²Π΅ΠΊΡ‚ΠΎΡ€Π° Π² качСствС прСдсказания возвращаСтся класс (ΠΈΠ»ΠΈ число Π² случаС рСгрСссии). Π›ΡƒΡ‡ΡˆΠ΅Π³ΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π° ΠΌΠΎΠΆΠ½ΠΎ Π΄ΠΎΡΡ‚ΠΈΡ‡ΡŒ, Ссли всС Π΄Π°Π½Π½Ρ‹Π΅ Π±ΡƒΠ΄ΡƒΡ‚ Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ Π² ΠΎΠ΄Π½ΠΎΠΌ Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π΅, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΎΡ‚ 0 Π΄ΠΎ 1.

8. ΠœΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² (SVM)

ΠœΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ², вСроятно, ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ популярных ΠΈ обсуТдаСмых Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния.

Π“ΠΈΠΏΠ΅Ρ€ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒ β€” это линия, Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‰Π°Ρ пространство Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…. Π’ ΠΌΠ΅Ρ‚ΠΎΠ΄Π΅ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒ выбираСтся Ρ‚Π°ΠΊ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Ρ€Π°Π·Π΄Π΅Π»ΡΡ‚ΡŒ Ρ‚ΠΎΡ‡ΠΊΠΈ Π² плоскости Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… ΠΏΠΎ ΠΈΡ… классу: 0 ΠΈΠ»ΠΈ 1. Π’ Π΄Π²ΡƒΠΌΠ΅Ρ€Π½ΠΎΠΉ плоскости это ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ ΠΊΠ°ΠΊ линию, которая ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ раздСляСт Ρ‚ΠΎΡ‡ΠΊΠΈ всСх классов. Π’ΠΎ врСмя обучСния Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΈΡ‰Π΅Ρ‚ коэффициСнты, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΠΌΠΎΠ³Π°ΡŽΡ‚ Π»ΡƒΡ‡ΡˆΠ΅ Ρ€Π°Π·Π΄Π΅Π»ΡΡ‚ΡŒ классы Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒΡŽ.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

РасстояниС ΠΌΠ΅ΠΆΠ΄Ρƒ Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒΡŽ ΠΈ блиТайшими Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ… называСтся Ρ€Π°Π·Π½ΠΈΡ†Π΅ΠΉ. Π›ΡƒΡ‡ΡˆΠ°Ρ ΠΈΠ»ΠΈ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Π°Ρ Π³ΠΈΠΏΠ΅Ρ€ΠΏΠ»ΠΎΡΠΊΠΎΡΡ‚ΡŒ, Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‰Π°Ρ Π΄Π²Π° класса, β€” это линия с наибольшСй Ρ€Π°Π·Π½ΠΈΡ†Π΅ΠΉ. Волько эти Ρ‚ΠΎΡ‡ΠΊΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠΈ гипСрплоскости ΠΈ ΠΏΡ€ΠΈ построСнии классификатора. Π­Ρ‚ΠΈ Ρ‚ΠΎΡ‡ΠΊΠΈ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΎΠΏΠΎΡ€Π½Ρ‹ΠΌΠΈ Π²Π΅ΠΊΡ‚ΠΎΡ€Π°ΠΌΠΈ. Для опрСдСлСния Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ коэффициСнтов, ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰ΠΈΡ… Ρ€Π°Π·Π½ΠΈΡ†Ρƒ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ ΡΠΏΠ΅Ρ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ.

ΠœΠ΅Ρ‚ΠΎΠ΄ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ², Π½Π°Π²Π΅Ρ€Π½ΠΎΠ΅, ΠΎΠ΄ΠΈΠ½ ΠΈΠ· самых эффСктивных классичСских классификаторов, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Ρ‘Π½Π½ΠΎ стоит ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅.

Π‘Π»ΡƒΡ‡Π°ΠΉΠ½Ρ‹ΠΉ лСс β€” ΠΎΡ‡Π΅Π½ΡŒ популярный ΠΈ эффСктивный Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ машинного обучСния. Π­Ρ‚ΠΎ Ρ€Π°Π·Π½ΠΎΠ²ΠΈΠ΄Π½ΠΎΡΡ‚ΡŒ ансамблСвого Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΠΎΠ³ΠΎ бэггингом.

Бутстрэп являСтся эффСктивным статистичСским ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΊΠ°ΠΊΠΎΠΉ-Π»ΠΈΠ±ΠΎ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ Π²Ρ€ΠΎΠ΄Π΅ срСднСго значСния. Π’Ρ‹ Π±Π΅Ρ€Ρ‘Ρ‚Π΅ мноТСство ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ ΠΈΠ· Π²Π°ΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…, считаСтС срСднСС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ, Π° Π·Π°Ρ‚Π΅ΠΌ усрСдняСтС Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ для получСния Π»ΡƒΡ‡ΡˆΠ΅ΠΉ ΠΎΡ†Π΅Π½ΠΊΠΈ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ срСднСго значСния.

Π’ бэггингС ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Ρ‚ΠΎΡ‚ ΠΆΠ΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄, Π½ΠΎ для ΠΎΡ†Π΅Π½ΠΊΠΈ всСх статистичСских ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Ρ‡Π°Ρ‰Π΅ всСго ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. Π’Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ Ρ€Π°Π·Π±ΠΈΠ²Π°ΡŽΡ‚ΡΡ Π½Π° мноТСство Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ, для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ создаётся модСль. Когда Π½ΡƒΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ прСдсказаниС, Ρ‚ΠΎ Π΅Π³ΠΎ Π΄Π΅Π»Π°Π΅Ρ‚ каТдая модСль, Π° Π·Π°Ρ‚Π΅ΠΌ прСдсказания ΡƒΡΡ€Π΅Π΄Π½ΡΡŽΡ‚ΡΡ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ Π²Ρ‹Ρ…ΠΎΠ΄Π½ΠΎΠΌΡƒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΡŽ.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

Π’ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ΅ случайного лСса для всСх Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ ΠΈΠ· Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… строятся Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. ΠŸΡ€ΠΈ построСнии Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² для создания ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΡƒΠ·Π»Π° Π²Ρ‹Π±ΠΈΡ€Π°ΡŽΡ‚ΡΡ случайныС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ. Π’ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π½Π΅ ΠΎΡ‡Π΅Π½ΡŒ Ρ‚ΠΎΡ‡Π½Ρ‹, Π½ΠΎ ΠΏΡ€ΠΈ ΠΈΡ… объСдинСнии качСство прСдсказания Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠ»ΡƒΡ‡ΡˆΠ°Π΅Ρ‚ΡΡ.

Если Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ с высокой диспСрсиСй, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π½Π° Π²Π°ΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚ΠΎ этот Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π·Π°Ρ‡Π°ΡΡ‚ΡƒΡŽ ΠΌΠΎΠΆΠ½ΠΎ ΡƒΠ»ΡƒΡ‡ΡˆΠΈΡ‚ΡŒ, ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠ² бэггинг.

Бустинг β€” это сСмСйство ансамблСвых Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², ΡΡƒΡ‚ΡŒ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Π² создании сильного классификатора Π½Π° основС Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… слабых. Для этого сначала создаётся ΠΎΠ΄Π½Π° модСль, Π·Π°Ρ‚Π΅ΠΌ другая модСль, которая пытаСтся ΠΈΡΠΏΡ€Π°Π²ΠΈΡ‚ΡŒ ошибки Π² ΠΏΠ΅Ρ€Π²ΠΎΠΉ. МодСли Π΄ΠΎΠ±Π°Π²Π»ΡΡŽΡ‚ΡΡ Π΄ΠΎ Ρ‚Π΅Ρ… ΠΏΠΎΡ€, ΠΏΠΎΠΊΠ° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ Π½Π΅ Π±ΡƒΠ΄ΡƒΡ‚ идСально ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒΡΡ ΠΈΠ»ΠΈ ΠΏΠΎΠΊΠ° Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€Π΅Π²Ρ‹ΡˆΠ΅Π½ΠΎ максимальноС количСство ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ.

AdaBoost Π±Ρ‹Π» ΠΏΠ΅Ρ€Π²Ρ‹ΠΌ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΡΠΏΠ΅ΡˆΠ½Ρ‹ΠΌ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ бустинга, Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½Ρ‹ΠΌ для Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации. ИмСнно с Π½Π΅Π³ΠΎ Π»ΡƒΡ‡ΡˆΠ΅ всСго Π½Π°Ρ‡ΠΈΠ½Π°Ρ‚ΡŒ знакомство с бустингом. Π‘ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Π²Ρ€ΠΎΠ΄Π΅ стохастичСского Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ бустинга ΠΎΡΠ½ΠΎΠ²Ρ‹Π²Π°ΡŽΡ‚ΡΡ Π½Π° AdaBoost.

Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация. Π€ΠΎΡ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΡ‹ машинного обучСния классификация

AdaBoost ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ вмСстС с ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΠΌΠΈ Π΄Π΅Ρ€Π΅Π²ΡŒΡΠΌΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ. ПослС создания ΠΏΠ΅Ρ€Π²ΠΎΠ³ΠΎ Π΄Π΅Ρ€Π΅Π²Π° провСряСтся Π΅Π³ΠΎ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½ΠΎΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π΅, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ½ΡΡ‚ΡŒ, сколько внимания Π΄ΠΎΠ»ΠΆΠ½ΠΎ ΡƒΠ΄Π΅Π»ΠΈΡ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π΅ Π΄Π΅Ρ€Π΅Π²ΠΎ всСм ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌ. Π’Π΅ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ слоТно ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, даётся больший вСс, Π° Ρ‚Π΅ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π»Π΅Π³ΠΊΠΎ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ, β€” мСньший. МодСли ΡΠΎΠ·Π΄Π°ΡŽΡ‚ΡΡ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ΄Π½Π° Π·Π° Π΄Ρ€ΡƒΠ³ΠΎΠΉ, ΠΈ каТдая ΠΈΠ· Π½ΠΈΡ… обновляСт вСса для ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ Π΄Π΅Ρ€Π΅Π²Π°. ПослС построСния всСх Π΄Π΅Ρ€Π΅Π²ΡŒΠ΅Π² Π΄Π΅Π»Π°ΡŽΡ‚ΡΡ прСдсказания для Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π΄Π΅Ρ€Π΅Π²Π° опрСдСляСтся Ρ‚Π΅ΠΌ, насколько Ρ‚ΠΎΡ‡Π½Ρ‹ΠΌ ΠΎΠ½ΠΎ Π±Ρ‹Π»ΠΎ Π½Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ….

Π’Π°ΠΊ ΠΊΠ°ΠΊ Π² этом Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ΅ большоС Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ удСляСтся ΠΈΡΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΡŽ ошибок ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Π²Π°ΠΆΠ½ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π² Π΄Π°Π½Π½Ρ‹Ρ… отсутствовали Π°Π½ΠΎΠΌΠ°Π»ΠΈΠΈ.

ΠŸΠ°Ρ€Π° слов напослСдок

Когда Π½ΠΎΠ²ΠΈΡ‡ΠΊΠΈ видят всё Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·ΠΈΠ΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ², ΠΎΠ½ΠΈ Π·Π°Π΄Π°ΡŽΡ‚ΡΡ стандартным вопросом: «А ΠΊΠ°ΠΊΠΎΠΉ слСдуСт ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠ½Π΅?Β» ΠžΡ‚Π²Π΅Ρ‚ Π½Π° этот вопрос зависит ΠΎΡ‚ мноТСства Ρ„Π°ΠΊΡ‚ΠΎΡ€ΠΎΠ²:

Π”Π°ΠΆΠ΅ ΠΎΠΏΡ‹Ρ‚Π½Ρ‹ΠΉ data scientist Π½Π΅ скаТСт, ΠΊΠ°ΠΊΠΎΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠ΅, ΠΏΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΏΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅Ρ‚ нСсколько Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ΠΎΠ². БущСствуСт мноТСство Π΄Ρ€ΡƒΠ³ΠΈΡ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ² машинного обучСния, Π½ΠΎ ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½Π½Ρ‹Π΅ Π²Ρ‹ΡˆΠ΅ β€” Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ популярныС. Если Π²Ρ‹ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π·Π½Π°ΠΊΠΎΠΌΠΈΡ‚Π΅ΡΡŒ с ΠΌΠ°ΡˆΠΈΠ½Π½Ρ‹ΠΌ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ, Ρ‚ΠΎ ΠΎΠ½ΠΈ Π±ΡƒΠ΄ΡƒΡ‚ Ρ…ΠΎΡ€ΠΎΡˆΠ΅ΠΉ ΠΎΡ‚ΠΏΡ€Π°Π²Π½ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠΎΠΉ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *