mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Записная ΠΊΠ½ΠΈΠΆΠΊΠ°

ΠšΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½ΠΎΠ΅ Π·Ρ€Π΅Π½ΠΈΠ΅, машинноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти ΠΈ Ρ‚.ΠΏ.

Mask R-CNN

Π Π°Π·Π±Π΅Ρ€Ρ‘ΠΌ ΡΡ‚Π°Ρ‚ΡŒΡŽ [1], Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ описана ΡΠ΅Ρ‚ΡŒ, Ρ€Π΅ΡˆΠ°ΡŽΡ‰Π°Ρ Π·Π°Π΄Π°Ρ‡Ρƒ сСгмСнтации экзСмпляра ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° (object instance segmentation). Авторы ΠΏΡ€Π΅Π΄Π»Π°Π³Π°ΡŽΡ‚ ΡΠ΅Ρ‚ΡŒ, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΎΠ½ΠΈ Π½Π°Π·Π²Π°Π»ΠΈ Mask R-CNN. Mask R-CNN Π±Π΅Ρ€Ρ‘Ρ‚ Π·Π° основу Faster R-CNN ΠΈ добавляСт ΠΊ Π½Π΅ΠΉ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ Π²Π΅Ρ‚Π²ΡŒ. Π­Ρ‚Π° Π²Π΅Ρ‚Π²ΡŒ Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ Π΄ΠΎΠ»ΠΆΠ½Π° Π²Ρ‹Π΄Π°Ρ‚ΡŒ маску ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° Π² Π΄ΠΎΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ ΠΊ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΠ²Π°ΡŽΡ‰Π΅ΠΌΡƒ ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΡƒ ΠΈ классу.

Π’Π½Π°Ρ‡Π°Π»Π΅ вспомним Faster R-CNN ΡΠ΅Ρ‚ΡŒ ΠΈΠ· [2].

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Она состоит ΠΈΠ· Ρ‚Ρ€Ρ‘Ρ… частСй:

Π“Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€ особСнностСй (features extractor), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ, ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ² Π½Π° Π²Ρ…ΠΎΠ΄ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅, Π²Ρ‹Π΄Π°Ρ‘Ρ‚ 3Ρ…-ΠΌΠ΅Ρ€Π½Ρ‹ΠΉ Ρ‚Π΅Π½Π·ΠΎΡ€ особСнностСй. ΠŸΡ€ΠΈ этом ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡƒ Π²Π΅ΠΊΡ‚ΠΎΡ€Ρƒ особСнностСй ΠΈΠ· этого Ρ‚Π΅Π½Π·ΠΎΡ€Π° соотвСтствуСт Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊ исходного изобраТСния. Π’ качСствС Ρ‚Π°ΠΊΠΎΠ³ΠΎ Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€Π° ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹ΡΡ‚ΡƒΠΏΠ°Ρ‚ΡŒ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΡΠ΅Ρ‚ΡŒ VGG16 ΠΈΠ»ΠΈ ResNet101 Π±Π΅Π· полносвязных слоёв.

Region Proposal Network (RPN). Π‘Π΅Ρ‚ΡŒ, которая ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ² Π½Π° Π²Ρ…ΠΎΠ΄ Ρ‚Π΅Π½Π·ΠΎΡ€ особСнностСй, Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ количСство Ρ€Π΅Π³ΠΈΠΎΠ½ΠΎΠ², Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π΅ΡΡ‚ΡŒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹

3.1. класс ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° (Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, Ρ‡Ρ‚ΠΎ класс Π±ΡƒΠ΄Π΅Ρ‚ background)

3.2. ΡƒΡ‚ΠΎΡ‡Π½Ρ‘Π½Π½Ρ‹ΠΉ ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π’Π°ΠΆΠ½ΠΎ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ нСсколько Π·Π°ΠΌΠ΅Ρ‡Π°Π½ΠΈΠΉ ΠΎΠ± ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠΈ Mask R-CNN ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π° ΠΎΡ‚ случая сСгмСнтации изобраТСния.

ВСрнёмся ΠΊ Mask R-CNN сСти.

Π‘ΠΎΠ»ΡŒΡˆΠ°Ρ Ρ‡Π°ΡΡ‚ΡŒ Faster R-CNN схСмы сохранСна (Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€ особСнностСй, RPN, полносвязныС слои для получСния класса ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΈ уточнСния ΠΏΡ€ΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠ°). Класс ΠΈ ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΡΠ΅Ρ‚ΡŒ Π²Ρ‹Π΄Π°Ρ‘Ρ‚ Π² Π²ΠΈΠ΄Π΅ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ² нСбольшой размСрности (для класса это Π²Π΅ΠΊΡ‚ΠΎΡ€ вСроятностСй, для ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠ° Π²Π΅ΠΊΡ‚ΠΎΡ€ свигов ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚), ΠΈ ΠΈΡ… Π»ΠΎΠ³ΠΈΡ‡Π½ΠΎ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ полносвязныС слои. Однако, маску, которая ΠΏΠΎ сути Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅, СстСствСнно Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ, сохраняя ΠΏΡ€ΠΎΡΡ‚Ρ€Π°Π½ΡΡ‚Π²Π΅Π½Π½ΡƒΡŽ структуру, ΠΈΠΌΠ΅ΡŽΡ‰ΡƒΡŽΡΡ Π² Ρ‚Π΅Π½Π·ΠΎΡ€Π΅ особСнностСй. А Π·Π½Π°Ρ‡ΠΈΡ‚ вмСсто полносвязных слоёв Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ свёрточныС. Π­Ρ‚ΠΎ Π² Ρ‚ΠΎΠΌ числС ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ число ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ², Π° Π·Π½Π°Ρ‡ΠΈΡ‚ упростит Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΊΡƒ.

RoIAlign

Π•Ρ‰Π΅ ΠΎΠ΄Π½ΠΎ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π² структурС сСти, связанноС с ΠΆΠ΅Π»Π°Π½ΠΈΠ΅ΠΌ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ маску ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°, это Π·Π°ΠΌΠ΅Π½Π° RoIPool слоя Π½Π° RoIAlign. RoIPool слой появился Π² Fast R-CNN ΠΈ Π±Ρ‹Π» Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ смыслС ΡƒΠΏΡ€ΠΎΡ‰Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π° SPPooling ΠΈΠ· [4]. Для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ RoI Π½Π° Ρ‚Π΅Π½Π·ΠΎΡ€ особСнностСй Π½Π°ΠΊΠ»Π°Π΄Ρ‹Π²Π°Π»Π°ΡΡŒ сСтка с фиксированным числом ячССк (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 7×7) ΠΈ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ячСйкС сСтки примСнялся MaxPooling, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠ° ΠΏΡ€Π΅Ρ‚Π΅Π½Π΄Π΅Π½Ρ‚Π° получался Ρ‚Π΅Π½Π·ΠΎΡ€ особСнностСй, Π½ΠΎ ΡƒΠΆΠ΅ фиксированных пространствСнных размСрностСй (Ρ‚Π΅ самыС 7×7). ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈ ΠΈΠ·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠΈ особСнностСй для ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠ° ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ RoIPool ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹, ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Ρ‹ ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠ° ΠΎΠΊΡ€ΡƒΠ³Π»ΡΡŽΡ‚ΡΡ, Π° ячСйки Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ€Π°Π·Π±ΠΈΡ‚ RoI Π²Ρ‹Ρ€Π°Π²Π½ΠΈΠ²Π°ΡŽΡ‚ΡΡ ΠΏΠΎ Π³Ρ€Π°Π½ΠΈΡ†Π°ΠΌ особСнностСй. Π’ случаС ΠΊΠΎΠ³Π΄Π° ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ класс ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΈ Π΅Π³ΠΎ располоТСниС Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ, Ρ‚Π°ΠΊΠΎΠΉ β€œΠ½Π΅ точный” ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ нас Π²ΠΏΠΎΠ»Π½Π΅ устраиваСт, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π΄Π°Π½Π½Ρ‹Π΅ характСристики ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° устойчивы ΠΊ ΠΌΠ°Π»Ρ‹ΠΌ сдвигам. Однако, для ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠ΅ маски это ΡƒΠΏΡ€ΠΎΡ‰Π΅Π½ΠΈΠ΅ Π½Π΅ Π΄Π°Ρ‘Ρ‚ достаточной точности.

Для наглядности рассмотрим ΠΏΡ€ΠΎΡΡ‚ΡƒΡŽ ΡΠΈΡ‚ΡƒΠ°Ρ†ΠΈΡŽ, ΠΊΠΎΠ³Π΄Π° Π½Π° RoI накладываСтся сСтка 2×2:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

RoIPool послС округлСния ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ ΠΈ выравнивания ячССк ΠΏΠΎ Π³Ρ€Π°Π½ΠΈΡ†Π°ΠΌ особСнностСй выдаст ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΉ Π½Π°Π±ΠΎΡ€:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

УтвСрТдаСтся (Π² [1] Π΅ΡΡ‚ΡŒ Ρ‚Π°Π±Π»ΠΈΡ†Π° с Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π°ΠΌΠΈ тСстов), Ρ‡Ρ‚ΠΎ использованиС RoIAlign слоя ΡƒΠ»ΡƒΡ‡ΡˆΠ°Π΅Ρ‚ качСство Ρ€Π°Π±ΠΎΡ‚Ρ‹ сСти, ΠΊΠ°ΠΊ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ случая RoIPool, Ρ‚Π°ΠΊ ΠΈ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ случая использования ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π°Π²Ρ‚ΠΎΡ€Ρ‹ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ RoIWarp (см. [5]). ΠŸΡ€ΠΈΡ‡Π΅ΠΌ прирост качСства ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ RoIPool составляСт порядка 7%.

Π‘ΠΎ структурой сСти Ρ€Π°Π·ΠΎΠ±Ρ€Π°Π»ΠΈΡΡŒ, ΠΎΡΡ‚Π°Π»ΠΎΡΡŒ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΊΠ°ΠΊ измСнится ΡˆΡ‚Ρ€Π°Ρ„Π½Π°Ρ функция ΠΈ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΊΠΈ. Π’ случаС Faster R-CNN ΡˆΡ‚Ρ€Π°Ρ„Π½Π°Ρ функция состояла ΠΈΠ· Π΄Π²ΡƒΡ… слагаСмых:

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

Π”Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Π² Ρ€Π°ΠΌΠΊΠ°Ρ… Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ‡ΠΈ instance segmentation Π΄Π°Ρ‘Ρ‚ ΠΎΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠ΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹. Π’ качСствС ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° нСсколько ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΎΠΊ ΠΈΠ· ΡΡ‚Π°Ρ‚ΡŒΠΈ [1]:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠΉ сСгмСнтации Ρ‚Π°ΠΊΠΆΠ΅ понятны, большиС протяТСнныС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π΄ΠΎΡ€ΠΎΠ³ΠΈ, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ ΠΈΡΠΊΠ°Ρ‚ΡŒ Π±ΡƒΠ΄Π΅Ρ‚ Ρ‚Ρ€ΡƒΠ΄Π½ΠΎΠ²Π°Ρ‚ΠΎ.

Π›ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Π°

Kaiming He, Georgia Gkioxari, Piotr Dollar, Ross Girshick, β€œMask R-CNN”. arXiv:1409.4842 2017-2018

S. Ren, K. He, R. Girshick, and J. Sun, β€œFaster R-CNN: Towards real-time object detection with region proposal networks,” in Neural Information Processing Systems (NIPS), 2015.

E. Shelhamer, J. Long, T. Darrell, β€œFully Convolutional Networks for Semantic Segmentation.” arXiv:1605.06211 2016

K. He, X. Zhang, S. Ren, J. Sun, β€œSpatial pyramid pooling in deep convolutional networks for visual recognition.” arXiv:1406.4729, 2014

K. He, J. Dai, J. Sun, β€œInstance-aware Semantic Segmentation via Multi-task Network Cascades” arXiv:1512.04412, 2015

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ConvNets. Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ ΠΏΡ€ΠΎΡ‚ΠΎΡ‚ΠΈΠΏΠ° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Mask R-CNN

ΠŸΡ€ΠΈΠ²Π΅Ρ‚, Π₯Π°Π±Ρ€! ΠœΡ‹, Π½Π°ΠΊΠΎΠ½Π΅Ρ†, доТдались Π΅Ρ‰Π΅ ΠΎΠ΄Π½ΠΎΠΉ части сСрии ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ² ΠΎΡ‚ выпускника Π½Π°ΡˆΠΈΡ… ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌ β€œΠ‘ΠΏΠ΅Ρ†ΠΈΠ°Π»ΠΈΡΡ‚ ΠΏΠΎ большим данным” ΠΈ β€œDeep Learning”, ΠšΠΈΡ€ΠΈΠ»Π»Π° Π”Π°Π½ΠΈΠ»ΡŽΠΊΠ°, ΠΎΠ± использовании популярных Π½Π° сСгодняшний дСнь Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Ρ… сСтСй Mask R-CNN ΠΊΠ°ΠΊ части систСмы для классификации ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Π° ΠΈΠΌΠ΅Π½Π½ΠΎ ΠΎΡ†Π΅Π½ΠΊΠΈ качСства ΠΏΡ€ΠΈΠ³ΠΎΡ‚ΠΎΠ²Π»Π΅Π½Π½ΠΎΠ³ΠΎ блюда ΠΏΠΎ Π½Π°Π±ΠΎΡ€Ρƒ Π΄Π°Π½Π½Ρ‹Ρ… с сСнсоров.

РассмотрСв Π² ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰Π΅ΠΉ ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΈΠ³Ρ€ΡƒΡˆΠ΅Ρ‡Π½Ρ‹ΠΉ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…, состоящий ΠΈΠ· ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹Ρ… Π·Π½Π°ΠΊΠΎΠ², Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠ΅Ρ€Π΅ΠΉΡ‚ΠΈ ΠΊ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ Π·Π°Π΄Π°Ρ‡ΠΈ, с ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ я столкнулся Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΆΠΈΠ·Π½ΠΈ: Β«Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ Π»ΠΈ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ Deep Learning Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΌΠΎΠ³ Π±Ρ‹ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΡ‚ΡŒ блюда высокого качСства ΠΎΡ‚ ΠΏΠ»ΠΎΡ…ΠΈΡ… блюд ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΉ Ρ„ΠΎΡ‚ΠΎΠ³Ρ€Π°Ρ„ΠΈΠΈ?Β». Π’ΠΊΡ€Π°Ρ‚Ρ†Π΅, бизнСс Ρ…ΠΎΡ‚Π΅Π» Π²ΠΎΡ‚ это:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π§Ρ‚ΠΎ прСдставляСт бизнСс, ΠΊΠΎΠ³Π΄Π° Π΄ΡƒΠΌΠ°Π΅Ρ‚ ΠΎ машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ:

Π­Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π½Π΅ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ поставлСнной Π·Π°Π΄Π°Ρ‡ΠΈ: Π² Π΄Π°Π½Π½ΠΎΠΌ случаС Π½Π΅Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ, сущСствуСт Π»ΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅, ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎ ΠΈ устойчиво Π»ΠΈ ΠΎΠ½ΠΎ. К Ρ‚ΠΎΠΌΡƒ ΠΆΠ΅ сама постановка Π·Π°Π΄Π°Ρ‡ΠΈ ΠΎΡ‡Π΅Π½ΡŒ расплывчата, Π½Π΅ говоря ΡƒΠΆΠ΅ ΠΎ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π΅Π΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ. ΠšΠΎΠ½Π΅Ρ‡Π½ΠΎ, данная ΡΡ‚Π°Ρ‚ΡŒΡ Π½Π΅ посвящСна эффСктивности ΠΊΠΎΠΌΠΌΡƒΠ½ΠΈΠΊΠ°Ρ†ΠΈΠΉ ΠΈΠ»ΠΈ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΡŽ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°ΠΌΠΈ, ΠΎΠ΄Π½Π°ΠΊΠΎ Π²Π°ΠΆΠ½ΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ: Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ Π±Π΅Ρ€ΠΈΡ‚Π΅ΡΡŒ Π·Π° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Ρ‹, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π½Π΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ ΠΈ зафиксирован Π² Π’Π—. Один ΠΈΠ· Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ Π½Π°Π΄Π΅ΠΆΠ½Ρ‹Ρ… способов ΡΠΏΡ€Π°Π²ΠΈΡ‚ΡŒΡΡ с Ρ‚Π°ΠΊΠΎΠΉ Π½Π΅ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΡΡ‚ΡŒΡŽ β€” это сначала ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΡ‚ΠΎΡ‚ΠΈΠΏ, Π° Π·Π°Ρ‚Π΅ΠΌ, использовав Π½ΠΎΠ²Ρ‹Π΅ знания, ΡΡ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ всю ΠΎΡΡ‚Π°Π»ΡŒΠ½ΡƒΡŽ Π·Π°Π΄Π°Ρ‡Ρƒ. ИмСнно Ρ‚Π°ΠΊ ΠΌΡ‹ ΠΈ поступили.

ΠŸΠΎΡΡ‚Π°Π½ΠΎΠ²ΠΊΠ° Π·Π°Π΄Π°Ρ‡ΠΈ

Π’ своСм ΠΏΡ€ΠΎΡ‚ΠΎΡ‚ΠΈΠΏΠ΅ я сосрСдоточился Π½Π° ΠΎΠ΄Π½ΠΎΠΌ блюдС ΠΈΠ· мСню β€” ΠΎΠΌΠ»Π΅Ρ‚Π΅ β€” ΠΈ построил ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΉ ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ опрСдСляСт «качСство» ΠΎΠΌΠ»Π΅Ρ‚Π°. ΠŸΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ это ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠΏΠΈΡΠ°Ρ‚ΡŒ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

Главная Ρ†Π΅Π»ΡŒ ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½Π° β€” Π½Π°ΡƒΡ‡ΠΈΡ‚ΡŒΡΡ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ нСсколько Ρ‚ΠΈΠΏΠΎΠ² сигналов (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, изобраТСния с Ρ€Π°Π·Π½Ρ‹Ρ… ракурсов, Ρ‚Π΅ΠΏΠ»ΠΎΠΊΠ°Ρ€Ρ‚Ρƒ ΠΈ Ρ‚.Π΄.), ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ² ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ сТатоС прСдставлСниС ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΈΠ· Π½ΠΈΡ… ΠΈ пропустив Π² дальнСйшСм эти Ρ„ΠΈΡ‡ΠΈ Ρ‡Π΅Ρ€Π΅Π· Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ-классификатор для ΠΈΡ‚ΠΎΠ³ΠΎΠ²ΠΎΠ³ΠΎ прСдсказания. Π’Π°ΠΊ, ΠΌΡ‹ смоТСм Π²ΠΎΠΏΠ»ΠΎΡ‚ΠΈΡ‚ΡŒ Π² Тизнь наш ΠΏΡ€ΠΎΡ‚ΠΎΡ‚ΠΈΠΏ ΠΈ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ Π΅Π³ΠΎ практичСски ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠΌΡ‹ΠΌ Π² дальнСйшСй Ρ€Π°Π±ΠΎΡ‚Π΅. НиТС прСдставлСны нСсколько ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Π½Π½Ρ‹Ρ… Π² ΠΏΡ€ΠΎΡ‚ΠΎΡ‚ΠΈΠΏΠ΅ сигналов:

ΠžΠ±Ρ‰ΠΈΠΉ взгляд Π½Π° ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½

ΠžΡ‚ΠΌΠ΅Ρ‡Ρƒ, Ρ‡Ρ‚ΠΎ ΠΌΠ½Π΅ придСтся ΠΏΡ€ΠΎΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ нСсколько Π²Π°ΠΆΠ½Ρ‹Ρ… этапов, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ Ρ€Π°Π·Π²Π΅Π΄ΠΎΡ‡Π½Ρ‹ΠΉ Π°Π½Π°Π»ΠΈΠ· Π΄Π°Π½Π½Ρ‹Ρ…, построСниС Π±Π°Π·ΠΎΠ²ΠΎΠ³ΠΎ классификатора ΠΈ active labeling (мною ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π½Ρ‹ΠΉ Ρ‚Π΅Ρ€ΠΌΠΈΠ½, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ полуавтоматичСскоС Π°Π½Π½ΠΎΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², Π²Π΄ΠΎΡ…Π½ΠΎΠ²Π»Π΅Π½Π½Ρ‹ΠΉ Polygon-RNN Π΄Π΅ΠΌΠΎ-Π²ΠΈΠ΄Π΅ΠΎ) ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½ для Mask R-CNN (ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ ΠΎΠ± этом Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… постах).

ВзглянСм Π½Π° вСсь ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½ Π² Ρ†Π΅Π»ΠΎΠΌ:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
Π’ Π΄Π°Π½Π½ΠΎΠΉ ΡΡ‚Π°Ρ‚ΡŒΠ΅ нас ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΡƒΡŽΡ‚ этапы Mask R-CNN ΠΈ классификации Π² Ρ€Π°ΠΌΠΊΠ°Ρ… ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½Π°

Π”Π°Π»Π΅Π΅ ΠΌΡ‹ рассмотрим Ρ‚Ρ€ΠΈ этапа: 1) использованиС Mask R-CNN для построСния масок ΠΈΠ½Π³Ρ€Π΅Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΎΠΌΠ»Π΅Ρ‚Π°; 2) ConvNet классификатор Π½Π° основС Keras; 3) визуализация Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ², ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ t-SNE.

Π­Ρ‚Π°ΠΏ 1: Mask R-CNN ΠΈ построСниС масок

Mask R-CNN (MRCNN) Π² послСднСС врСмя находятся Π½Π° ΠΏΠΈΠΊΠ΅ популярности. Начиная ΠΎΡ‚ исходной ΡΡ‚Π°Ρ‚ΡŒΠΈ Facebook-Π° ΠΈ заканчивая Data Science Bowl 2018 Π½Π° Kaggle, Mask R-CNN Π·Π°Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΠΎΠ²Π°Π»Π° сСбя ΠΊΠ°ΠΊ мощная Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° для instance segmentation (Ρ‚.Π΅., Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ попиксСльной сСгмСнтации ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, Π½ΠΎ ΠΈ отдСлСния Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ°Ρ‰ΠΈΡ… ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ классу). К Ρ‚ΠΎΠΌΡƒ ΠΆΠ΅, ΠΎΠ΄Π½ΠΎ ΡƒΠ΄ΠΎΠ²ΠΎΠ»ΡŒΡΡ‚Π²ΠΈΠ΅ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ MRCNN ΠΎΡ‚ Matterport Π² Keras. Код ΠΎΡ‚Π»ΠΈΡ‡Π½ΠΎ структурирован, ΠΈΠΌΠ΅Π΅Ρ‚ Ρ…ΠΎΡ€ΠΎΡˆΡƒΡŽ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡŽ ΠΈ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ прямо ΠΈΠ· ΠΊΠΎΡ€ΠΎΠ±ΠΊΠΈ, Ρ…ΠΎΡ‚ΡŒ ΠΈ ΠΌΠ΅Π΄Π»Π΅Π½Π½Π΅Π΅, Ρ‡Π΅ΠΌ оТидалось.

На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅, особСнно ΠΏΡ€ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ ΠΏΡ€ΠΎΡ‚ΠΎΡ‚ΠΈΠΏΠ°, критичСски Π²Π°ΠΆΠ½ΠΎ ΠΈΠΌΠ΅Ρ‚ΡŒ ΠΏΡ€Π΅Π΄ΠΎΠ±ΡƒΡ‡Π΅Π½Π½ΡƒΡŽ ΡΠ²Ρ‘Ρ€Ρ‚ΠΎΡ‡Π½ΡƒΡŽ Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ. Π’ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²Π΅ случаСв Π½Π°Π±ΠΎΡ€ Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Ρƒ data scientist-Π° вСсьма ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½, Π»ΠΈΠ±ΠΎ Π΅Π³ΠΎ Π½Π΅Ρ‚ совсСм, Π² Ρ‚ΠΎ врСмя ΠΊΠ°ΠΊ ConvNet Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ большого количСства Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π΄ΠΎΡΡ‚ΠΈΠ³Π½ΡƒΡ‚ΡŒ сходимости (Ρ‚Π°ΠΊ, Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… ImageNet содСрТит 1,2 ΠΌΠ»Π½ Ρ€Π°Π·ΠΌΠ΅Ρ‡Π΅Π½Π½Ρ‹Ρ… ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ). Π’ΡƒΡ‚ Π½Π° ΠΏΠΎΠΌΠΎΡ‰ΡŒ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ transfer learning: ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ Π·Π°Ρ„ΠΈΠΊΡΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ вСса свёрточных слоСв ΠΈ Π΄ΠΎΠΎΠ±ΡƒΡ‡ΠΈΡ‚ΡŒ лишь классификатор. Π€ΠΈΠΊΡΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ свёрточныС слои Π²Π°ΠΆΠ½ΠΎ для Π½Π΅Π±ΠΎΠ»ΡŒΡˆΠΈΡ… датасСтов, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ такая Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ° ΠΏΡ€Π΅Π΄ΠΎΡ‚Π²Ρ€Π°Ρ‰Π°Π΅Ρ‚ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅.

Π’ΠΎΡ‚ Ρ‡Ρ‚ΠΎ я ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» послС ΠΏΠ΅Ρ€Π²ΠΎΠΉ эпохи дообучСния:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ сСгмСнтации ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ²: распознаны всС ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Π΅ ΠΈΠ½Π³Ρ€Π΅Π΄ΠΈΠ΅Π½Ρ‚Ρ‹

На ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΌ этапС ΠΏΠ°ΠΉΠΏΠ»Π°ΠΉΠ½Π° (Process Inferenced Data for Classifier) Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π²Ρ‹Ρ€Π΅Π·Π°Ρ‚ΡŒ Ρ‚Ρƒ Ρ‡Π°ΡΡ‚ΡŒ изобраТСния, которая содСрТит Ρ‚Π°Ρ€Π΅Π»ΠΊΡƒ, ΠΈ ΠΈΠ·Π²Π»Π΅Ρ‡ΡŒ Π΄Π²ΡƒΠΌΠ΅Ρ€Π½ΡƒΡŽ Π±ΠΈΠ½Π°Ρ€Π½ΡƒΡŽ маску для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΈΠ½Π³Ρ€Π΅Π΄ΠΈΠ΅Π½Ρ‚Π° Π½Π° этой Ρ‚Π°Ρ€Π΅Π»ΠΊΠ΅:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
ΠšΡ€ΠΎΠΏΡ‹ изобраТСния с ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹ΠΌΠΈ ΠΈΠ½Π³Ρ€Π΅Π΄ΠΈΠ΅Π½Ρ‚Π°ΠΌΠΈ Π² Π²ΠΈΠ΄Π΅ Π±ΠΈΠ½Π°Ρ€Π½Ρ‹Ρ… масок

Π­Ρ‚ΠΈ Π±ΠΈΠ½Π°Ρ€Π½Ρ‹Π΅ маски Π·Π°Ρ‚Π΅ΠΌ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΡƒΡŽΡ‚ΡΡ Π² 8-канальноС ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ (ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ я ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΠ» 8 классов масок для MRCNN), ΠΈ ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ Π‘ΠΈΠ³Π½Π°Π» β„–1:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
Π‘ΠΈΠ³Π½Π°Π» β„–1: 8-канальноС ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅, состоящСС ΠΈΠ· Π±ΠΈΠ½Π°Ρ€Π½Ρ‹Ρ… масок. Π’ Ρ†Π²Π΅Ρ‚Π΅ для Π»ΡƒΡ‡ΡˆΠ΅ΠΉ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ

Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π‘ΠΈΠ³Π½Π°Π» β„–2, я посчитал количСство Ρ€Π°Π·, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ½Π³Ρ€Π΅Π΄ΠΈΠ΅Π½Ρ‚ встрСчаСтся Π½Π° ΠΊΡ€ΠΎΠΏΠ΅ Ρ‚Π°Ρ€Π΅Π»ΠΊΠΈ ΠΈ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» Π½Π°Π±ΠΎΡ€ Π²Π΅ΠΊΡ‚ΠΎΡ€ΠΎΠ²-ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… соотвСтствуСт своСму ΠΊΡ€ΠΎΠΏΡƒ.

Π­Ρ‚Π°ΠΏ 2: ConvNet классификатор Π² Keras

CNN классификатор Π±Ρ‹Π» Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½ с нуля, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Keras. Π― Ρ…ΠΎΡ‚Π΅Π» ΡΠΊΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ нСсколько сигналов (Π‘ΠΈΠ³Π½Π°Π» β„–1 ΠΈ Π‘ΠΈΠ³Π½Π°Π» β„–2, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ΅ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ… Π² Π±ΡƒΠ΄ΡƒΡ‰Π΅ΠΌ) ΠΈ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ΡŒ нСйросСти ΠΏΠΎ Π½ΠΈΠΌ ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ качСства блюда. НиТС прСдставлСнная Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° являСтся ΠΏΡ€ΠΎΠ±Π½ΠΎΠΉ ΠΈ Π΄Π°Π»Π΅ΠΊΠ° ΠΎΡ‚ ΠΈΠ΄Π΅Π°Π»Π°:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

НСсколько слов ΠΏΠΎ ΠΏΠΎΠ²ΠΎΠ΄Ρƒ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹ классификатора:

Π­Ρ‚Π°ΠΏ 3: визуализация Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ t-SNE

Для Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Ρ€Π°Π±ΠΎΡ‚Ρ‹ классификатора Π½Π° тСстовых Π΄Π°Π½Π½Ρ‹Ρ… я использовал t-SNE β€” Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ позволяСт пСрСнСсти исходныС Π΄Π°Π½Π½Ρ‹Π΅ Π² пространство мСньшСй размСрности (Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°, Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡƒΡŽ ΠΏΡ€ΠΎΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ ΡΡ‚Π°Ρ‚ΡŒΡŽ-пСрвоисточник, ΠΎΠ½Π° Ρ‡Ρ€Π΅Π·Π²Ρ‹Ρ‡Π°ΠΉΠ½ΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ΠΈΠ²Π½Π° ΠΈ Ρ…ΠΎΡ€ΠΎΡˆΠΎ написана).

ΠŸΠ΅Ρ€Π΅Π΄ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ я взял тСстовыС изобраТСния, ΠΈΠ·Π²Π»Π΅ΠΊ Π»ΠΎΠ³ΠΈΡ‚-слой классификатора ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΠ» ΠΊ Π΄Π°Π½Π½ΠΎΠΌΡƒ датасСту Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ t-SNE. Π₯ΠΎΡ‚ΡŒ я ΠΈ Π½Π΅ ΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Π» Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ значСния ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° пСрплСксии, Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ всС Ρ€Π°Π²Π½ΠΎ выглядит Π²ΠΏΠΎΠ»Π½Π΅ Π½Π΅ΠΏΠ»ΠΎΡ…ΠΎ:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Ρ€Π°Π±ΠΎΡ‚Ρ‹ t-SNE Π½Π° тСстовых Π΄Π°Π½Π½Ρ‹Ρ… с прСдсказаниями классификатора

ΠšΠΎΠ½Π΅Ρ‡Π½ΠΎ, Π΄Π°Π½Π½Ρ‹ΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Π½Π΅ΠΈΠ΄Π΅Π°Π»Π΅Π½, ΠΎΠ΄Π½Π°ΠΊΠΎ ΠΎΠ½ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚. ΠŸΡ€ΠΈ этом Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠΉ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ довольно ΠΌΠ½ΠΎΠ³ΠΎ:

НачнитС с ΠΌΠ°Π»ΠΎΠ³ΠΎ: Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‰ΠΈΠΉ ΠΏΡ€ΠΎΡ‚ΠΎΡ‚ΠΈΠΏ ΠΌΠΎΠΆΠ½ΠΎ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ ΠΈΠ· Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΈΠ³Ρ€ΡƒΡˆΠ΅Ρ‡Π½Ρ‹Ρ… Π±Π»ΠΎΠΊΠΎΠ² ΠΊΠΎΠ΄Π°, ΠΈ ΠΎΠ½ Π² Ρ€Π°Π·Ρ‹ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΡ‚ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π΄Π°Π»ΡŒΠ½Π΅ΠΉΡˆΠΈΡ… бСсСд с руководством ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ. Π’ этом ΠΈ Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ΡΡ Ρ€Π°Π±ΠΎΡ‚Π° data scientist-Π° β€” ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Ρ‚ΡŒ бизнСсу Π½ΠΎΠ²Ρ‹Π΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρ‹ ΠΈ ΠΈΠ΄Π΅ΠΈ.

20 сСнтября 2018 стартуСт β€œΠ‘ΠΏΠ΅Ρ†ΠΈΠ°Π»ΠΈΡΡ‚ ΠΏΠΎ большим Π΄Π°Π½Π½Ρ‹ΠΌ 9.0”, Π³Π΄Π΅ Π²Ρ‹, ΠΏΠΎΠΌΠΈΠΌΠΎ всСго ΠΏΡ€ΠΎΡ‡Π΅Π³ΠΎ, Π½Π°ΡƒΡ‡ΠΈΡ‚Π΅ΡΡŒ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ ΠΈ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ бизнСс-Π»ΠΎΠ³ΠΈΠΊΡƒ, ΡΠΊΡ€Ρ‹Π²Π°ΡŽΡ‰ΡƒΡŽΡΡ Π·Π° Ρ‚ΠΎΠΉ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ΠΉ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ эффСктивнСС ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ вашСй Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΊΠΎΠ»Π»Π΅Π³Π°ΠΌ ΠΈ руководству.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Mask R-CNN ΠΎΡ‚ Π½ΠΎΠ²ΠΈΡ‡ΠΊΠ° Π΄ΠΎ профСссионала

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠžΠ΄Π½Π°ΠΆΠ΄Ρ‹ ΠΌΠ½Π΅ ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Π»ΠΎΡΡŒ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ с изобраТСния ΠΈ Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ ΠΈΠΌΠ΅Ρ‚ΡŒ Ρ‚ΠΈΠΏ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°, Π΅Π³ΠΎ Π²ΠΈΠ΄, Π° Ρ‚Π°ΠΊΠΆΠ΅, анализируя ΡΠΎΠ²ΠΎΠΊΡƒΠΏΠ½ΠΎΡΡ‚ΡŒ ΠΊΠ°Π΄Ρ€ΠΎΠ², ΠΌΠ½Π΅ Π½ΡƒΠΆΠ½ΠΎ Π±Ρ‹Π»ΠΎ Π²Ρ‹Π΄Π°Ρ‚ΡŒ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΈ врСмя прСбывания Π² ΠΊΠ°Π΄Ρ€Π΅, Π±Ρ‹Π»ΠΎ Π½ΡƒΠΆΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ ΠΊΠ°ΠΊ пСрСмСщался ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ ΠΈ Π² ΠΏΠΎΠ»Π΅ зрСния ΠΊΠ°ΠΊΠΈΡ… ΠΊΠ°ΠΌΠ΅Ρ€ ΠΏΠΎΠΏΠ°Π΄Π°Π». НачнСм, ΠΏΠΎΠΆΠ°Π»ΡƒΠΉ, с ΠΏΠ΅Ρ€Π²Ρ‹Ρ… Π΄Π²ΡƒΡ…, ΠΎ Π°Π½Π°Π»ΠΈΠ·Π΅ ΠΊΠ°Π΄Ρ€ΠΎΠ² Π² совокупности Ρ€Π΅Ρ‡ΡŒ ΠΏΠΎΠΉΠ΄Π΅Ρ‚ Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ части.

Ну Ρ‚Π°ΠΊ Ρ€Π°ΡΠΏΠΈΡˆΠ΅ΠΌ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Π΅Π΅ наши Π·Π°Π΄Π°Ρ‡ΠΈ:

Ок, ΠΏΠΎΠ΄ΡƒΠΌΠ°Π» я, ΠΈ взял Π² Ρ€ΡƒΠΊΠΈ Ρ‚ΠΎΠ»ΡΡ‚ΡƒΡŽ змСю, python, значится. Π‘Ρ‹Π»ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΡƒΡŽ сСтку Mask R-Cnn Π² связи с Π΅Π΅ простотой ΠΈ соврСмСнными характСристиками. Π’Π°ΠΊΠΆΠ΅, разумССтся, для манипуляция с изобраТСниями Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ OpenCV.

Установка срСды

Π‘ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Windows 10, ΠΈΠ·-Π·Π° Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Ρ‚Ρ‹ вСроятнСС всСго, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΡˆΡŒ ΠΈΠΌΠ΅Π½Π½ΠΎ Π΅Π΅.
ΠŸΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°Π΅Ρ‚ΡΡ, Ρ‡Ρ‚ΠΎ Ρƒ тСбя ΡƒΠΆΠ΅ присутствуСт 64 Π±ΠΈΡ‚Π½Ρ‹ΠΉ Python. Если ΠΆΠ΅ Π½Π΅Ρ‚, Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΡΠΊΠ°Ρ‡Π°Ρ‚ΡŒ ΠΏΠ°ΠΊΠ΅Ρ‚, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΎΡ‚ΡΡŽΠ΄Π°

Установка ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ²

Если ΠΏΠΎ ΠΊΠ°ΠΊΠΎΠΉ-Ρ‚ΠΎ ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π΅ Π½Π΅ удаСтся ΡΠΎΠ±Ρ€Π°Ρ‚ΡŒ ΠΈΠ· исходников, сущСствуСт вСрсия ΠΈΠ· pip:

К ΠΏΠ°ΠΊΠ΅Ρ‚Ρƒ, разумССтся, поставятся всС зависимости.

Π­Ρ‚Π°ΠΏ 1. Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ ΠΏΡ€ΠΎΡΡ‚Π΅ΠΉΡˆΠ΅ΠΉ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡ‹-распознаватСля.

Π‘Π΄Π΅Π»Π°Π΅ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΡ‹Π΅ ΠΈΠΌΠΏΠΎΡ€Ρ‚Ρ‹

ΠΠ΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ создания ΠΊΠΎΠ½Ρ„ΠΈΠ³Π° с ΠΏΠ΅Ρ€Π΅ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΌΠΈ полями

Π£ΠΊΠ°ΠΆΠ΅ΠΌ располоТСниС Ρ„Π°ΠΉΠ»Π° с вСсами. ΠŸΡƒΡΡ‚ΡŒ Π² Π΄Π°Π½Π½ΠΎΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ ΠΎΠ½ Π±ΡƒΠ΄Π΅Ρ‚ Π»Π΅ΠΆΠ°Ρ‚ΡŒ Π² ΠΏΠ°ΠΏΠΊΠ΅ с этим Ρ„Π°ΠΉΠ»ΠΎΠΌ. Если Π΅Π³ΠΎ Π½Π΅Ρ‚, Ρ‚ΠΎ ΠΎΠ½ скачаСтся.

Π‘ΠΎΠ·Π΄Π°Π΄ΠΈΠΌ Π½Π°ΡˆΡƒ модСль с настройками Π²Ρ‹ΡˆΠ΅

И ΠΏΠΎΠΆΠ°Π»ΡƒΠΉ, Π½Π°Ρ‡Π½Π΅ΠΌ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ всСх ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ Π² ΠΊΠ°Ρ‚Π°Π»ΠΎΠ³Π΅ images Π² Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΉ Π΄ΠΈΡ€Π΅ΠΊΡ‚ΠΎΡ€ΠΈΠΈ.

Π§Ρ‚ΠΎ ΠΆΠ΅ ΠΌΡ‹ ΡƒΠ²ΠΈΠ΄ΠΈΠΌ Π² detections?

НапримСр, Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ ΠΏΠΎΡ…ΠΎΠΆΠ΅Π΅:

Π’ Π΄Π°Π½Π½ΠΎΠΌ случаС нашли 2 ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°.
rois β€” массивы ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ Π»Π΅Π²ΠΎΠ³ΠΎ Π½ΠΈΠΆΠ½Π΅Π³ΠΎ ΠΈ ΠΏΡ€Π°Π²ΠΎΠ³ΠΎ Π²Π΅Ρ€Ρ…Π½Π΅Π³ΠΎ ΡƒΠ³Π»Π°
class_ids β€” числовыС ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€Ρ‹ Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹Ρ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², ΠΏΠΎΠΊΠ° Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Π·Π½Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ 1 β€” Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ, 3 β€” машина, 8 β€” Π³Ρ€ΡƒΠ·ΠΎΠ²ΠΈΠΊ.
scores β€” насколько модСль ΡƒΠ²Π΅Ρ€Π΅Π½Π° Π² Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΈ, этот ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚ΡΠ΅ΠΈΠ²Π°Ρ‚ΡŒ Ρ‡Π΅Ρ€Π΅Π· DETECTION_MIN_CONFIDENCE Π² ΠΊΠΎΠ½Ρ„ΠΈΠ³Π΅, отсСкая всС нСподходящиС Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹.
masks β€” ΠΊΠΎΠ½Ρ‚ΡƒΡ€ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°. Π”Π°Π½Π½Ρ‹Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ для рисования маски ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°. Π’.ΠΊ. ΠΎΠ½ΠΈ достаточно ΠΎΠ±ΡŠΠ΅ΠΌΠ½Ρ‹, ΠΈ Π½Π΅ ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Ρ‹ для понимания Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠΎΠΌ, ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ Π² ΡΡ‚Π°Ρ‚ΡŒΠ΅ ΠΈΡ… Π½Π΅ Π±ΡƒΠ΄Ρƒ.

Ок, ΠΌΡ‹ ΠΌΠΎΠ³Π»ΠΈ Π±Ρ‹ Π½Π° этом ΠΎΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒΡΡ, Π½ΠΎ ΠΌΡ‹ ΠΆΠ΅ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π²Ρ‹Π΄Π°ΡŽΡ‚ Π³Π°ΠΉΠ΄Ρ‹ ΠΏΠΎ использованию нСйросСток с красиво Π²Ρ‹Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΌΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌΠΈ?

Ѐункция Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅, ΠΈ основныС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ ΠΈΠ· словаря ΠΈΠ· ΠΏΠ΅Ρ€Π²Ρ‹Ρ… шагов.

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π₯отя ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ· основных прСимущСств этой Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти являСтся Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Π·Π°Π΄Π°Ρ‡ Instance segmentation β€” ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΊΠΎΠ½Ρ‚ΡƒΡ€ΠΎΠ² ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², ΠΌΡ‹ ΠΏΠΎΠΊΠ° этим Π½Π΅ воспользовались, Ρ€Π°Π·Π±Π΅Ρ€Π΅ΠΌ это.

Для Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ масок Π΄ΠΎΠ±Π°Π²ΠΈΠΌ ΠΏΠ°Ρ€Ρƒ строчСк ΠΏΠ΅Ρ€Π΅Π΄ отрисовкой ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠ° для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π½Π°ΠΉΠ΄Π΅Π½Π½ΠΎΠ³ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°.

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚:
mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π­Ρ‚Π°ΠΏ II. ΠŸΠ΅Ρ€Π²Ρ‹Π΅ успСхи. РаспознаваниС Π½ΠΎΠΌΠ΅Ρ€ΠΎΠ² машин.

Для распознавания Π½Π°ΠΌ Π½ΡƒΠΆΠ΅Π½ Ρ‡Π΅Ρ‚ΠΊΠΈΠΉ ΠΊΠ°Π΄Ρ€ ΠΌΠ°ΡˆΠΈΠ½Ρ‹ Π²Π±Π»ΠΈΠ·ΠΈ, поэтому Π±Ρ‹Π»ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΎ Π±Ρ€Π°Ρ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΊΠ°Π΄Ρ€Ρ‹ с КПП, Π° ΠΏΠΎΡ‚ΠΎΠΌ ΡΡ€Π°Π²Π½ΠΈΠ²Π°Ρ‚ΡŒ Π½Π° ΠΏΠΎΡ…ΠΎΠΆΠ΅ΡΡ‚ΡŒ(ΠΎΠ± этом Π² ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅ΠΉ Π³Π»Π°Π²Π΅). Π­Ρ‚ΠΎΡ‚ способ, ΠΏΡ€Π°Π²Π΄Π°, Π΄Π°Π΅Ρ‚ слишком Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ Π½Π΅Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ, Ρ‚.ΠΊ. ΠΌΠ°ΡˆΠΈΠ½Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΡ‡Π΅Π½ΡŒ ΠΏΠΎΡ…ΠΎΠΆΠΈΠΌΠΈ Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎ ΠΈ ΠΌΠΎΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΠΎΠΊΠ° Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠ·Π±Π΅Π³Π°Ρ‚ΡŒ Ρ‚Π°ΠΊΠΈΠ΅ ситуации.

Π‘Ρ‹Π»ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π³ΠΎΡ‚ΠΎΠ²ΡƒΡŽ Π»ΠΈΠ±Ρƒ ΠΎΡ‚ украинского производитСля nomeroff-net (Π½Π΅ Ρ€Π΅ΠΊΠ»Π°ΠΌΠ°). Π’.ΠΊ. ΠΏΠΎΡ‡Ρ‚ΠΈ вСсь ΠΊΠΎΠ΄ ΠΌΠΎΠΆΠ½ΠΎ Π½Π°ΠΉΡ‚ΠΈ Π² ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°Ρ… ΠΊ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‚ΠΎ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ ΠΏΠΎΠ»Π½ΠΎΠ΅ описаниС Π½Π΅ Π±ΡƒΠ΄Ρƒ.

Π‘ΠΊΠ°ΠΆΡƒ лишь, Ρ‡Ρ‚ΠΎ эту Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒ с исходным ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ΠΌ ΠΈΠ»ΠΈ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π½Π½ΡƒΡŽ ΠΌΠ°ΡˆΠΈΠ½Ρƒ ΠΌΠΎΠΆΠ½ΠΎ Π²Ρ‹Ρ€Π΅Π·Π°Ρ‚ΡŒ ΠΈΠ· ΠΊΠ°Π΄Ρ€Π° ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΡŒ Π² эту Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ.

Π­Ρ‚Π°ΠΏ III. ОпознаСм ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π½Π° ΡΡ…ΠΎΠΆΠ΅ΡΡ‚ΡŒ.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΊΠ°ΠΊ фиксируя ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ ΠΎΠ΄Π½Π°ΠΆΠ΄Ρ‹, ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ это ΠΈΠΌΠ΅Π½Π½ΠΎ ΠΎΠ½ Π½Π° сосСднСм ΠΊΠ°Π΄Ρ€Π΅. На Π΄Π°Π½Π½ΠΎΠΌ этапС Π±ΡƒΠ΄Π΅ΠΌ ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Ρƒ нас всСго лишь ΠΎΠ΄Π½Π° ΠΊΠ°ΠΌΠ΅Ρ€Π° ΠΈ Π±ΡƒΠ΄Π΅ΠΌ Ρ€Π°Π·Π»ΠΈΡ‡Π°Ρ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ€Π°Π·Π½Ρ‹Π΅ ΠΊΠ°Π΄Ρ€Ρ‹ с Π½Π΅Π΅.

Для этого Π½ΡƒΠΆΠ½ΠΎ ΡƒΠ·Π½Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ сравнСниС Π΄Π²ΡƒΡ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ².

ΠŸΡ€Π΅Π΄Π»ΠΎΠΆΡƒ для этих Ρ†Π΅Π»Π΅ΠΉ sift Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ. ΠžΠ³ΠΎΠ²ΠΎΡ€ΠΈΠΌΡΡ, Ρ‡Ρ‚ΠΎ ΠΎΠ½ Π½Π΅ Π²Ρ…ΠΎΠ΄ΠΈΡ‚ Π² ΠΎΡΠ½ΠΎΠ²Π½ΡƒΡŽ Ρ‡Π°ΡΡ‚ΡŒ OpenCV, поэтому Π½Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Π΄ΠΎΡΡ‚Π°Π²ΠΈΡ‚ΡŒ contrib ΠΌΠΎΠ΄ΡƒΠ»ΠΈ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ. К соТалСнию, Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π·Π°ΠΏΠ°Ρ‚Π΅Π½Ρ‚ΠΎΠ²Π°Π½ ΠΈ Π΅Π³ΠΎ использованиС Π² коммСрчСских ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ°Ρ… ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΎ. Но ΠΌΡ‹ Π½Π°Ρ†Π΅Π»Π΅Π½Ρ‹ Π½Π° Π½Π°ΡƒΡ‡Π½ΠΎ-ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΡƒΡŽ Π΄Π΅ΡΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ, Π½Π΅ Ρ‚Π°ΠΊ Π»ΠΈ?

ПишСм Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ, ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°ΡŽΡ‰ΡƒΡŽ 2 сравниваСмых ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° Π² Π²ΠΈΠ΄Π΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†. НапримСр, ΠΌΡ‹ ΠΈΡ… ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ послС Π²Ρ‹Π·ΠΎΠ²Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ cv2.open(path)

НапишСм Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ нашСго Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°.

Находим ΠΊΠ»ΡŽΡ‡Π΅Π²Ρ‹Π΅ Ρ‚ΠΎΡ‡ΠΊΠΈ ΠΈ дСскрипторы с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ SIFT. ΠŸΠΎΠΆΠ°Π»ΡƒΠΉ, Ρ…Π΅Π»ΠΏ для этих Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΏΡ€ΠΈΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ Π½Π΅ Π±ΡƒΠ΄Ρƒ, вСдь Π΅Π³ΠΎ всСгда Π΅Π³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ Π²Ρ‹Π·Π²Π°Ρ‚ΡŒ Π² ΠΈΠ½Ρ‚Π΅Ρ€Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎΠΉ ΠΎΠ±ΠΎΠ»ΠΎΡ‡ΠΊΠ΅ ΠΊΠ°ΠΊ help(somefunc)

Настроим наш Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ запустим Π΅Π³ΠΎ.

ΠŸΠΎΡΡ‡ΠΈΡ‚Π°Π΅ΠΌ сходства ΠΌΠ΅ΠΆΠ΄Ρƒ изобраТСниями

А Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ, ΠΏΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ Π΅Π³ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ
Для этого, послС обнаруТСния ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², Π½Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ ΠΈΡ… Π²Ρ‹Ρ€Π΅Π·Π°Ρ‚ΡŒ с исходного изобраТСния

Π― Π½Π΅ смог Π½Π°ΠΏΠΈΡΠ°Ρ‚ΡŒ Π½ΠΈΡ‡Π΅Π³ΠΎ Π»ΡƒΡ‡ΡˆΠ΅, Ρ‡Π΅ΠΌ ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π½Π° ΠΌΠ΅Π΄Π»Π΅Π½Π½ΡƒΡŽ ΠΏΠ°ΠΌΡΡ‚ΡŒ, Π° ΠΏΠΎΡ‚ΠΎΠΌ ΡƒΠΆΠ΅ ΠΎΡ‚Ρ‚ΡƒΠ΄Π° ΡΡ‡ΠΈΡ‚Ρ‹Π²Π°Ρ‚ΡŒ.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Ρƒ нас Π΅ΡΡ‚ΡŒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π² ΠΊΠ°Ρ‚Π°Π»ΠΎΠ³Π΅ /objectsOn

Π’Π΅ΠΏΠ΅Ρ€ΡŒ, Ссли Ρƒ нас Π΅ΡΡ‚ΡŒ ΠΊΠ°ΠΊ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌ 2 Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°Ρ‚Π°Π»ΠΎΠ³Π°, Ρ‚ΠΎ ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡΡ€Π°Π²Π½ΠΈΠ²Π°Ρ‚ΡŒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π² Π½ΠΈΡ…. Запустим Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ, Π½Π°ΠΏΠΈΡΠ°Π½Π½ΡƒΡŽ Ρ€Π°Π½Π΅Π΅

Или ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ Π΄Ρ€ΡƒΠ³ΠΎΠ΅ дСйствиС, Π²Ρ€ΠΎΠ΄Π΅ ΠΌΠ°Ρ€ΠΊΠΈΡ€ΠΎΠ²ΠΊΠΈ этих ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹ΠΌ айдишником.

ΠšΠΎΠ½Π΅Ρ‡Π½ΠΎ, ΠΊΠ°ΠΊ ΠΈ всС Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти, эта склонна Π΄Π°Π²Π°Ρ‚ΡŒ ΠΈΠ½ΠΎΠ³Π΄Π° ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½Ρ‹Π΅ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹.

Π’ Ρ†Π΅Π»ΠΎΠΌ, ΠΌΡ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΠ»ΠΈ 3 Π·Π°Π΄Π°Ρ‡ΠΈ, поставлСнныС Π² Π½Π°Ρ‡Π°Π»Π΅, Ρ‚Π°ΠΊ Ρ‡Ρ‚ΠΎ Π±ΡƒΠ΄Π΅ΠΌ Π·Π°ΠΊΡ€ΡƒΠ³Π»ΡΡ‚ΡŒΡΡ. Π― сомнСваюсь, Ρ‡Ρ‚ΠΎ эта ΡΡ‚Π°Ρ‚ΡŒΡ ΠΎΡ‚ΠΊΡ€Ρ‹Π»Π° Π³Π»Π°Π·Π° людям, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ написали хотя Π±Ρ‹ ΠΎΠ΄Π½Ρƒ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΡƒ, Ρ€Π΅ΡˆΠ°ΡŽΡ‰ΡƒΡŽ Π·Π°Π΄Π°Ρ‡ΠΈ image recognition/image segmentation, Π½ΠΎ я надСюсь, Ρ‡Ρ‚ΠΎ я ΠΏΠΎΠΌΠΎΠ³ хотя Π±Ρ‹ ΠΎΠ΄Π½ΠΎΠΌΡƒ Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰Π΅ΠΌΡƒ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΡƒ).

ΠŸΠΎΠ»Π½Ρ‹ΠΉ исходный ΠΊΠΎΠ΄ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ‚ΡƒΡ‚.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Mask R-CNN: Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° соврСмСнной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти для сСгмСнтации ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π½Π° изобраТСниях

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π’Ρ€Π΅ΠΌΠ΅Π½Π°, ΠΊΠΎΠ³Π΄Π° ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· самых Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½ΠΎΠ³ΠΎ зрСния Π±Ρ‹Π»Π° ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΎΡ‚Π»ΠΈΡ‡Π°Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎΠ³Ρ€Π°Ρ„ΠΈΠΈ собак ΠΎΡ‚ Ρ„ΠΎΡ‚ΠΎΠ³Ρ€Π°Ρ„ΠΈΠΉ кошСк, ΡƒΠΆΠ΅ ΠΎΡΡ‚Π°Π»ΠΈΡΡŒ Π² ΠΏΡ€ΠΎΡˆΠ»ΠΎΠΌ. На Π΄Π°Π½Π½Ρ‹ΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти способны Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ ΠΊΡƒΠ΄Π° Π±ΠΎΠ»Π΅Π΅ слоТныС ΠΈ интСрСсныС задания ΠΏΠΎ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ. Π’ частности, ΡΠ΅Ρ‚ΡŒ с Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ΠΎΠΉ Mask R-CNN позволяСт Π²Ρ‹Π΄Π΅Π»ΡΡ‚ΡŒ Π½Π° фотографиях ΠΊΠΎΠ½Ρ‚ΡƒΡ€Ρ‹ («маски») экзСмпляров Ρ€Π°Π·Π½Ρ‹Ρ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², Π΄Π°ΠΆΠ΅ Ссли Ρ‚Π°ΠΊΠΈΡ… экзСмпляров нСсколько, ΠΎΠ½ΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹ΠΉ Ρ€Π°Π·ΠΌΠ΅Ρ€ ΠΈ частично ΠΏΠ΅Ρ€Π΅ΠΊΡ€Ρ‹Π²Π°ΡŽΡ‚ΡΡ. Π‘Π΅Ρ‚ΡŒ Ρ‚Π°ΠΊ ΠΆΠ΅ способна ΠΊ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΡŽ ΠΏΠΎΠ· людСй Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ.

Π’ Π½Π°Ρ‡Π°Π»Π΅ этого Π³ΠΎΠ΄Π° ΠΌΠ½Π΅ довСлось Π² ΡƒΡ‡Π΅Π±Π½Ρ‹Ρ… цСлях ΠΏΠΎΡƒΡ‡Π°ΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ Π² сорСвновании Data Science Bowl 2018 Π½Π° Kaggle. Π’ ΡƒΡ‡Π΅Π±Π½Ρ‹Ρ… ΠΆΠ΅ цСлях мною Π±Ρ‹Π»Π° использована ΠΎΠ΄Π½Π° ΠΈΠ· Ρ‚Π΅Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²Π΅Π»ΠΈΠΊΠΎΠ΄ΡƒΡˆΠ½ΠΎ Π²Ρ‹ΠΊΠ»Π°Π΄Ρ‹Π²Π°ΡŽΡ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ участники, Π·Π°Π½ΠΈΠΌΠ°ΡŽΡ‰ΠΈΠ΅ высокиС ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ. Π­Ρ‚ΠΎ Π±Ρ‹Π»Π° Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ с Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ΠΎΠΉ Mask R-CNN, разработанная Π½Π΅Π΄Π°Π²Π½ΠΎ Facebook Research. (Π‘Ρ‚ΠΎΠΈΡ‚ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ побСдившая ΠΊΠΎΠΌΠ°Π½Π΄Π° использовала всё-Ρ‚Π°ΠΊΠΈ Π΄Ρ€ΡƒΠ³ΡƒΡŽ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρƒ β€” U-Net. Будя ΠΏΠΎ всСму, Π±ΠΎΠ»Π΅Π΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΡΡ‰ΡƒΡŽ для биомСдицинских Π·Π°Π΄Π°Ρ‡, ΠΊ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΠΈ ΠΎΡ‚Π½ΠΎΡΠΈΠ»ΠΎΡΡŒ Data Science Bowl 2018).
ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Ρ†Π΅Π»ΡŒ состояла Π² ΠΎΠ·Π½Π°ΠΊΠΎΠΌΠ»Π΅Π½ΠΈΠΈ с Π·Π°Π΄Π°Ρ‡Π°ΠΌΠΈ Deep Learning, Π° Π½Π΅ занятии высокого мСста, послС Π·Π°Π²Π΅Ρ€ΡˆΠ΅Π½ΠΈΡ сорСвнования ΠΎΡΡ‚Π°Π»ΠΎΡΡŒ стойкоС ΠΆΠ΅Π»Π°Π½ΠΈΠ΅ Ρ€Π°Π·ΠΎΠ±Ρ€Π°Ρ‚ΡŒΡΡ, ΠΊΠ°ΠΊ устроСна использованная Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ Β«ΠΏΠΎΠ΄ ΠΊΠ°ΠΏΠΎΡ‚ΠΎΠΌΒ». Данная ΡΡ‚Π°Ρ‚ΡŒΡ прСдставляСт ΠΎΠ±ΠΎΠ±Ρ‰Π΅Π½ΠΈΠ΅ свСдСний, ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΈΠ· ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ² с arXiv.org ΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… статСй Π½Π° Medium. ΠœΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π» носит ΠΈΡΠΊΠ»ΡŽΡ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ тСорСтичСский Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ (хотя Π² ΠΊΠΎΠ½Ρ†Π΅ Π΅ΡΡ‚ΡŒ ссылки ΠΏΡ€ΠΎ практичСскоС ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅), ΠΈ большСго, Ρ‡Π΅ΠΌ Π΅ΡΡ‚ΡŒ Π² ΡƒΠΊΠ°Π·Π°Π½Π½Ρ‹Ρ… источниках, ΠΎΠ½ Π½Π΅ содСрТит. Но ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΏΠΎ Ρ‚Π΅ΠΌΠ΅ Π½Π° русском ΠΌΠ°Π»ΠΎ, Ρ‚Π°ΠΊ Ρ‡Ρ‚ΠΎ, Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, ΡΡ‚Π°Ρ‚ΡŒΡ окаТСтся ΠΊΠΎΠΌΡƒ-Ρ‚ΠΎ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠΉ.

ВсС ΠΈΠ»Π»ΡŽΡΡ‚Ρ€Π°Ρ†ΠΈΠΈ взяты ΠΈΠ· Ρ‡ΡƒΠΆΠΈΡ… источников ΠΈ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ°Ρ‚ ΠΈΡ… Π·Π°ΠΊΠΎΠ½Π½Ρ‹ΠΌ правообладатСлям.

Π’ΠΈΠΏΡ‹ Π·Π°Π΄Π°Ρ‡ computer vision

ΠžΠ±Ρ‹Ρ‡Π½ΠΎ соврСмСнныС Π·Π°Π΄Π°Ρ‡ΠΈ ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€Π½ΠΎΠ³ΠΎ зрСния Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‚ Π½Π° Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅ Π²ΠΈΠ΄Π° (Π½Π΅ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΠ»ΠΎΡΡŒ Π²ΡΡ‚Ρ€Π΅Ρ‡Π°Ρ‚ΡŒ ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄Ρ‹ ΠΈΡ… Π½Π°Π·Π²Π°Π½ΠΈΠΉ Π΄Π°ΠΆΠ΅ Π² русскоязычных источниках, поэтому Π½Π° английском, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π½Π΅ ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ ΠΏΡƒΡ‚Π°Π½ΠΈΡ†Ρƒ):

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π­Π²ΠΎΠ»ΡŽΡ†ΠΈΠΎΠ½Π½ΠΎΡΡ‚ΡŒ развития Mask R-CNN

ΠšΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΠΈ, Π»Π΅ΠΆΠ°Ρ‰ΠΈΠ΅ Π² основС Π² Mask R-CNN ΠΏΡ€ΠΎΡˆΠ»ΠΈ поэтапноС Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠ΅ Ρ‡Π΅Ρ€Π΅Π· Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΡ‡Π½Ρ‹Ρ… нСйросСтСй, Ρ€Π΅ΡˆΠ°Π²ΡˆΠΈΡ… Ρ€Π°Π·Π½Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ ΠΈΠ· ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½Π½ΠΎΠ³ΠΎ Π²Ρ‹ΡˆΠ΅ списка. ВСроятно, самый простой способ Ρ€Π°Π·ΠΎΠ±Ρ€Π°Ρ‚ΡŒΡΡ Π² ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ°Ρ… функционирования Π΄Π°Π½Π½ΠΎΠΉ сСти β€” ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ всС эти этапы.

НС ΠΎΡΡ‚Π°Π½Π°Π²Π»ΠΈΠ²Π°ΡΡΡŒ Π½Π° Π±Π°Π·ΠΎΠ²Ρ‹Ρ… Π²Π΅Ρ‰Π°Ρ… Π²Ρ€ΠΎΠ΄Π΅ backpropagation, Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, ΠΈ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΈΠ· сСбя прСдставляСт многослойная нСйронная ΡΠ΅Ρ‚ΡŒ Π² Ρ†Π΅Π»ΠΎΠΌ, ΠΊΡ€Π°Ρ‚ΠΊΠΎ ΠΏΠΎΡΡΠ½ΠΈΡ‚ΡŒ, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ слои Convolution Neural Networks, вСроятно, всё-Ρ‚Π°ΠΊΠΈ стоит (R-CNN ΠΆΠ΅).

Convolution ΠΈ MaxPooling

Π‘Π²Π΅Ρ€Ρ‚ΠΎΡ‡Π½Ρ‹ΠΉ (convolutional) слой позволяСт ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡ‚ΡŒ значСния располоТСнных рядом пиксСлСй ΠΈ Π²Ρ‹Π΄Π΅Π»ΡΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ ΠΎΠ±ΠΎΠ±Ρ‰Ρ‘Π½Π½Ρ‹Π΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ изобраТСния. Для этого ΠΏΠΎ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‚ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π½Ρ‹ΠΌ ΠΎΠΊΠ½ΠΎΠΌ нСбольшого Ρ€Π°Π·ΠΌΠ΅Ρ€Π° (3Ρ…3, 5Ρ…5, 7Ρ…7 пиксСлСй ΠΈ Ρ‚.ΠΏ.) Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΌ ядром (kernel). ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ элСмСнт ядра ΠΈΠΌΠ΅Π΅Ρ‚ свой вСсовой коэффициСнт, ΡƒΠΌΠ½ΠΎΠΆΠ°Π΅ΠΌΡ‹ΠΉ Π½Π° Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ρ‚ΠΎΠ³ΠΎ пиксСля изобраТСния, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π² Π΄Π°Π½Π½Ρ‹ΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚ Π½Π°Π»ΠΎΠΆΠ΅Π½ элСмСнт ядра. Π—Π°Ρ‚Π΅ΠΌ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ для всСго ΠΎΠΊΠ½Π° числа ΡΠΊΠ»Π°Π΄Ρ‹Π²Π°ΡŽΡ‚ΡΡ, ΠΈ эта взвСшСнная сумма Π΄Π°Ρ‘Ρ‚ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΎΡ‡Π΅Ρ€Π΅Π΄Π½ΠΎΠ³ΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°.

Для получСния ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ (Β«ΠΊΠ°Ρ€Ρ‚Ρ‹Β») ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² всСго изобраТСния, ядро ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ сдвигаСтся ΠΏΠΎ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΠΈ ΠΈ Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΠΈ. Π’ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΡ… слоях опСрация свСртки примСняСтся ΡƒΠΆΠ΅ ΠΊ ΠΊΠ°Ρ€Ρ‚Π°ΠΌ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΌ ΠΈΠ· ΠΏΡ€Π΅Π΄Ρ‹Π΄ΡƒΡ‰ΠΈΡ… слоёв. ГрафичСски процСсс ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΎΠΈΠ»Π»ΡŽΡΡ‚Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Π°ΠΊ:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π˜Π·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ ΠΈΠ»ΠΈ ΠΊΠ°Ρ€Ρ‚Ρ‹ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π² Ρ€Π°ΠΌΠΊΠ°Ρ… ΠΎΠ΄Π½ΠΎΠ³ΠΎ слоя ΠΌΠΎΠ³ΡƒΡ‚ ΡΠΊΠ°Π½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒΡΡ Π½Π΅ ΠΎΠ΄Π½ΠΈΠΌ, Π° нСсколькими нСзависимыми Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°ΠΌΠΈ, давая Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄ Π½Π΅ ΠΎΠ΄Π½Ρƒ ΠΊΠ°Ρ€Ρ‚Ρƒ, Π° нСсколько (ΠΈΡ… Π΅Ρ‰Ρ‘ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ Β«ΠΊΠ°Π½Π°Π»Π°ΠΌΠΈΒ»). Настройка вСсов ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π° происходит ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ всё Ρ‚ΠΎΠΉ ΠΆΠ΅ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ backpropagation.

ΠžΡ‡Π΅Π²ΠΈΠ΄Π½ΠΎ, Ссли ядро Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π° ΠΏΡ€ΠΈ сканировании Π½Π΅ Π²Ρ‹Ρ…ΠΎΠ΄ΠΈΡ‚ Π·Π° ΠΏΡ€Π΅Π΄Π΅Π»Ρ‹ изобраТСния, Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒ ΠΊΠ°Ρ€Ρ‚Ρ‹ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Π±ΡƒΠ΄Π΅Ρ‚ мСньшС, Ρ‡Π΅ΠΌ Ρƒ исходной ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ. Если Π½ΡƒΠΆΠ½ΠΎ ΡΠΎΡ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Ρ‚ΠΎΡ‚ ΠΆΠ΅ Ρ€Π°Π·ΠΌΠ΅Ρ€, ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡŽΡ‚ Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Π΅ paddings β€” значСния, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌΠΈ дополняСтся ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ ΠΏΠΎ краям ΠΈ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΡ‚ΠΎΠΌ Π·Π°Ρ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‚ΡΡ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠΌ вмСстС с Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ пиксСлями ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ.

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Помимо paddings Π½Π° ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ размСрности Ρ‚Π°ΠΊ ΠΆΠ΅ Π²Π»ΠΈΡΡŽΡ‚ strides β€” значСния шага, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΠΎΠΊΠ½ΠΎ пСрСмСщаСтся ΠΏΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ/ΠΊΠ°Ρ€Ρ‚Π΅.

Π‘Π²Ρ‘Ρ€Ρ‚ΠΊΠ° Π½Π΅ являСтся СдинствСнным способом получСния ΠΎΠ±ΠΎΠ±Ρ‰Ρ‘Π½Π½ΠΎΠΉ характСристики Π³Ρ€ΡƒΠΏΠΏΡ‹ пиксСлСй. Π‘Π°ΠΌΡ‹ΠΉ простой способ для этого β€” Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΎΠ΄ΠΈΠ½ пиксСль ΠΏΠΎ Π·Π°Π΄Π°Π½Π½ΠΎΠΌΡƒ ΠΏΡ€Π°Π²ΠΈΠ»Ρƒ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ β€” ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ. ИмСнно это ΠΈ Π΄Π΅Π»Π°Π΅Ρ‚ слой MaxPooling.

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π’ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ convolution, maxpooling ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ примСняСтся ΠΊ Π½Π΅ΠΏΠ΅Ρ€Π΅ΡΠ΅ΠΊΠ°ΡŽΡ‰ΠΈΠΌΡΡ Π³Ρ€ΡƒΠΏΠΏΠ°ΠΌ пиксСлСй.

АрхитСктура сСти R-CNN (Regions With CNNs) Π±Ρ‹Π»Π° Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π° ΠΊΠΎΠΌΠ°Π½Π΄ΠΎΠΉ ΠΈΠ· UC Berkley для примСнСния Convolution Neural Networks ΠΊ Π·Π°Π΄Π°Ρ‡Π΅ object detection. Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΠΎΠ²Π°Π²ΡˆΠΈΠ΅ Π½Π° Ρ‚ΠΎΡ‚ ΠΌΠΎΠΌΠ΅Π½Ρ‚ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρ‹ ΠΊ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ Ρ‚Π°ΠΊΠΈΡ… Π·Π°Π΄Π°Ρ‡ ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΠ»ΠΈΡΡŒ ΠΊ масимуму своих возмоТностСй ΠΈ Π·Π½Π°Ρ‡ΠΈΠΌΠΎ ΡƒΠ»ΡƒΡ‡ΡˆΠΈΡ‚ΡŒ ΠΈΡ… ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ Π½Π΅ ΠΏΠΎΠ»ΡƒΡ‡Π°Π»ΠΎΡΡŒ.

CNN Ρ…ΠΎΡ€ΠΎΡˆΠΎ ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π»ΠΈ сСбя Π² классификации ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ, ΠΈ Π² Π΄Π°Π½Π½ΠΎΠΉ сСти ΠΎΠ½ΠΈ ΠΏΠΎ сути Π±Ρ‹Π»ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½Ρ‹ для Ρ‚ΠΎΠ³ΠΎ ΠΆΠ΅ самого. Для этого Π½Π° Π²Ρ…ΠΎΠ΄ CNN подавалось Π½Π΅ всё ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ Ρ†Π΅Π»ΠΈΠΊΠΎΠΌ, Π° ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π²Ρ‹Π΄Π΅Π»Π΅Π½Π½Ρ‹Π΅ Π΄Ρ€ΡƒΠ³ΠΈΠΌ способом Ρ€Π΅Π³ΠΈΠΎΠ½Ρ‹, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΈΠΌΠ΅ΡŽΡ‚ΡΡ ΠΊΠ°ΠΊΠΈΠ΅-Ρ‚ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹. На Ρ‚ΠΎΡ‚ ΠΌΠΎΠΌΠ΅Π½Ρ‚ Ρ‚Π°ΠΊΠΈΡ… ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΎΠ² Π±Ρ‹Π»ΠΎ нСсколько, Π°Π²Ρ‚ΠΎΡ€Ρ‹ Π²Ρ‹Π±Ρ€Π°Π»ΠΈ Selective Search, хотя ΠΎΠ½ΠΈ ΡƒΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ особых ΠΏΡ€ΠΈΡ‡ΠΈΠ½ для прСдпочтСния ΠΈΠΌΠ΅Π½Π½ΠΎ Π΅Π³ΠΎ Π½Π΅Ρ‚.

Π’ качСствС CNN-сСти использовалась Ρ‚Π°ΠΊ ΠΆΠ΅ готовая Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° β€” CaffeNet (AlexNet). Π’Π°ΠΊΠΈΠ΅ нСйросСти, ΠΊΠ°ΠΊ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ для Π½Π°Π±ΠΎΡ€Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ ImageNet, проводят ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡŽ Π½Π° 1000 классов. R-CNN Ρ€Π°Π·Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°Π»Π°ΡΡŒ для дСтСктирования ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² мСньшСго количСства классов (N= 20 ΠΈΠ»ΠΈ 200), поэтому послСдний классификационный слой CaffeNet Π±Ρ‹Π» Π·Π°ΠΌΠ΅Π½Ρ‘Π½ Π½Π° слой с N+1 Π²Ρ‹Ρ…ΠΎΠ΄Π°ΠΌΠΈ (с Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ классом для Ρ„ΠΎΠ½Π°).

Selective Search Π²Ρ‹Π΄Π°Π²Π°Π» ΠΎΠΊΠΎΠ»ΠΎ 2000 Ρ€Π΅Π³ΠΈΠΎΠ½ΠΎΠ² Ρ€Π°Π·Π½ΠΎΠ³ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΈ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΉ сторон, ΠΎΠ΄Π½Π°ΠΊΠΎ CaffeNet ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Π΅Ρ‚ Π½Π° Π²Ρ…ΠΎΠ΄ изобраТСния фиксированного Ρ€Π°Π·ΠΌΠ΅Ρ€Π° 227Ρ…227 пиксСлСй, поэтому ΠΏΠ΅Ρ€Π΅Π΄ ΠΏΠΎΠ΄Π°Ρ‡Π΅ΠΉ Ρ€Π΅Π³ΠΈΠΎΠ½ΠΎΠ² Π½Π° Π²Ρ…ΠΎΠ΄ сСти ΠΈΡ… ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΠ»ΠΎΡΡŒ ΠΌΠΎΠ΄ΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ. Для этого ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ ΠΈΠ· Ρ€Π΅Π³ΠΈΠΎΠ½Π° Π·Π°ΠΊΠ»ΡŽΡ‡Π°Π»ΠΎΡΡŒ Π² наимСньший ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΉ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚. Π’Π΄ΠΎΠ»ΡŒ Ρ‚ΠΎΠΉ (мСньшСй) стороны, ΠΏΠΎ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Ρ‹Π²Π°Π»ΠΈΡΡŒ поля, добавлялось нСсколько «контСкстных» (ΠΎΠΊΡ€ΡƒΠΆΠ°ΡŽΡ‰ΠΈΡ… Ρ€Π΅Π³ΠΈΠΎΠ½) пиксСлСй изобраТСния, ΠΎΡΡ‚Π°Π²ΡˆΠ°ΡΡΡ Ρ‡Π°ΡΡ‚ΡŒ поля Π½ΠΈΡ‡Π΅ΠΌ Π½Π΅ заполнялась. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΉ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π»ΡΡ ΠΏΠΎΠ΄ Ρ€Π°Π·ΠΌΠ΅Ρ€ 227×227 ΠΈ подавался Π½Π° Π²Ρ…ΠΎΠ΄ CaffeNet.

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

НСсмотря Π½Π° Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ CNN Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²Π°Π»Π°ΡΡŒ Π½Π° распознаваниС N+1 классов, Π² ΠΈΡ‚ΠΎΠ³Π΅ ΠΎΠ½Π° использовалась Ρ‚ΠΎΠ»ΡŒΠΊΠΎ для извлСчСния фиксированного 4096-Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΠ³ΠΎ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ². НСпосрСдствСнным ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ занимались N Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… SVM, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΈΠ· ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΠ» Π±ΠΈΠ½Π°Ρ€Π½ΡƒΡŽ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡŽ ΠΏΠΎ своСму Ρ‚ΠΈΠΏΡƒ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ², опрСдСляя Π΅ΡΡ‚ΡŒ Π»ΠΈ Ρ‚Π°ΠΊΠΎΠΉ Π² ΠΏΠ΅Ρ€Π΅Π΄Π°Π½Π½ΠΎΠΌ Ρ€Π΅Π³ΠΈΠΎΠ½Π΅ ΠΈΠ»ΠΈ Π½Π΅Ρ‚. Π’ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠΌ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅ вся ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Π° ΠΈΠ»Π»ΡŽΡΡ‚Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ΡΡ Ρ‚Π°ΠΊΠΎΠΉ схСмой:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Авторы ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ процСсс классификации Π² SVM происходит вСсьма ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ, прСдставляя собой ΠΏΠΎ сути просто ΠΌΠ°Ρ‚Ρ€ΠΈΡ‡Π½Ρ‹Π΅ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΈ. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ ΠΈΠ· CNN Π²Π΅ΠΊΡ‚ΠΎΡ€Ρ‹ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΡŽΡ‚ΡΡ ΠΏΠΎ всСм Ρ€Π΅Π³ΠΈΠΎΠ½Π°ΠΌ Π² ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ 2000Ρ…4096, которая Π·Π°Ρ‚Π΅ΠΌ умноТаСтся Π½Π° ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ 4096xN с вСсами SVM.

Надо ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Selective Search Ρ€Π΅Π³ΠΈΠΎΠ½Ρ‹ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΌΠΎΠ³ΡƒΡ‚ ΡΠΎΠ΄Π΅Ρ€ΠΆΠ°Ρ‚ΡŒ ΠΊΠ°ΠΊΠΈΠ΅-Ρ‚ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹, ΠΈ Π½Π΅ Ρ„Π°ΠΊΡ‚, Ρ‡Ρ‚ΠΎ содСрТат ΠΈΡ… Ρ†Π΅Π»ΠΈΠΊΠΎΠΌ. Π‘Ρ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π»ΠΈ Ρ€Π΅Π³ΠΈΠΎΠ½ содСрТащим ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ ΠΈΠ»ΠΈ Π½Π΅Ρ‚, ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΠ»ΠΎΡΡŒ ΠΏΠΎ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ΅ Intersection over Union (IoU). Π­Ρ‚Π° ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° прСдставляСт собой ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ пСрСсСчСния ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΎΠ³ΠΎ Ρ€Π΅Π³ΠΈΠΎΠ½Π°-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚Π° с ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠΎΠΌ, Π½Π° самом Π΄Π΅Π»Π΅ ΠΎΠ±Ρ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚, ΠΊ ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ объСдинСния этих ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠΎΠ². Если ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ прСвосходит Π·Π°Π΄Π°Π½Π½ΡƒΡŽ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΡƒΡŽ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρƒ, Ρ€Π΅Π³ΠΈΠΎΠ½-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ считаСтся содСрТащим Π½ΡƒΠΆΠ½Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚.

IoU Ρ‚Π°ΠΊ ΠΆΠ΅ использовался для отсСивания ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½ΠΎΠ³ΠΎ количСства Ρ€Π΅Π³ΠΈΠΎΠ½ΠΎΠ², содСрТащих ΠΎΠΏΡ€Π΅Π΄Π΅Π»Ρ‘Π½Π½Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ (non-maximum suppression). Если IoU Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ Ρ€Π΅Π³ΠΈΠΎΠ½Π° с Ρ€Π΅Π³ΠΈΠΎΠ½ΠΎΠΌ, ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ²ΡˆΠΈΠΌ для Ρ‚ΠΎΠ³ΠΎ ΠΆΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚, Π±Ρ‹Π» Π²Ρ‹ΡˆΠ΅ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ ΠΏΠΎΡ€ΠΎΠ³Π°, ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ Ρ€Π΅Π³ΠΈΠΎΠ½ просто отбрасывался.

Π’ Ρ…ΠΎΠ΄Π΅ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ error analysis Π°Π²Ρ‚ΠΎΡ€Ρ‹ Ρ‚Π°ΠΊ ΠΆΠ΅ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π»ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄, ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‰ΠΈΠΉ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΡ‚ΡŒ ΠΎΡˆΠΈΠ±ΠΊΡƒ выдСлСния ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰Π΅ΠΉ Ρ€Π°ΠΌΠΊΠΈ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° β€” bounding-box regression. ПослС классификации содСрТимого Ρ€Π΅Π³ΠΈΠΎΠ½Π°-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚Π°, ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии Π½Π° основС ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈΠ· CNN ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΠ»ΠΈΡΡŒ Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Π° β€” (dx, dy, dw, dh). Они описывали, насколько Π½Π°Π΄ΠΎ ΡΠ΄Π²ΠΈΠ½ΡƒΡ‚ΡŒ Ρ†Π΅Π½Ρ‚Ρ€ Ρ€Π°ΠΌΠΊΠΈ Ρ€Π΅Π³ΠΈΠΎΠ½Π° ΠΏΠΎ Ρ… ΠΈ Ρƒ, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π½Π° сколько ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ Π΅Ρ‘ ΡˆΠΈΡ€ΠΈΠ½Ρƒ ΠΈ высоту, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ‚ΠΎΡ‡Π½Π΅Π΅ ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°Ρ‚ΡŒ распознанный ΠΎΠ±ΡŠΠ΅ΠΊΡ‚.

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρƒ дСтСктирования ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΡΠ΅Ρ‚ΡŒΡŽ R-CNN ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·Π΄Π΅Π»ΠΈΡ‚ΡŒ Π½Π° ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ шаги:

Fast R-CNN

НСсмотря Π½Π° высокиС Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹, ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ R-CNN Π±Ρ‹Π»Π° всё ΠΆΠ΅ нСвысока, особСнно для Π±ΠΎΠ»Π΅Π΅ Π³Π»ΡƒΠ±ΠΎΠΊΠΈΡ…, Ρ‡Π΅ΠΌ CaffeNet сСтСй (Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ VGG16). ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ bounding box regressor ΠΈ SVM Ρ‚Ρ€Π΅Π±ΠΎΠ²Π°Π»ΠΎ сохранСния Π½Π° диск большого количСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², поэтому ΠΎΠ½ΠΎ Π±Ρ‹Π»ΠΎ Π΄ΠΎΡ€ΠΎΠ³ΠΈΠΌ с Ρ‚ΠΎΡ‡ΠΊΠΈ зрСния Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π°.

Авторы Fast R-CNN ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠΈΠ»ΠΈ ΡƒΡΠΊΠΎΡ€ΠΈΡ‚ΡŒ процСсс Π·Π° счёт ΠΏΠ°Ρ€Ρ‹ ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΉ:

Π‘ΠΈΠ½Π°Ρ€Π½Ρ‹Π΅ SVM Π½Π΅ использовались, вмСсто этого Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹Π΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ ΠΏΠ΅Ρ€Π΅Π΄Π°Π²Π°Π»ΠΈΡΡŒ Π½Π° полносвязанный слой, Π° Π·Π°Ρ‚Π΅ΠΌ Π½Π° Π΄Π²Π° ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹Ρ… слоя: softmax с K+1 Π²Ρ‹Ρ…ΠΎΠ΄Π°ΠΌΠΈ (ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ Π½Π° ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ класс + 1 для Ρ„ΠΎΠ½Π°) ΠΈ bounding box regressor.

ΠžΠ±Ρ‰Π°Ρ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° сСти выглядит Ρ‚Π°ΠΊ:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π—Π΄Π΅ΡΡŒ:
mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅β€” класс ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°, Ρ€Π΅Π°Π»ΡŒΠ½ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΡ‘Π½Π½ΠΎΠ³ΠΎ Π² Ρ€Π΅Π³ΠΈΠΎΠ½Π΅-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚Π΅;
mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn обучСниС– log loss для класса u;
mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn обучСниС– Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Π΅ измСнСния Ρ€Π°ΠΌΠΊΠΈ Ρ€Π΅Π³ΠΈΠΎΠ½Π° для Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½ΠΎΠ³ΠΎ охватывания ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°;
mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn обучСниС– прСдсказанныС измСнСния Ρ€Π°ΠΌΠΊΠΈ Ρ€Π΅Π³ΠΈΠΎΠ½Π°;
mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn обучСниС– loss-функция ΠΌΠ΅ΠΆΠ΄Ρƒ прСдсказанными ΠΈ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ измСнСниями Ρ€Π°ΠΌΠΊΠΈ;
mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn обучСниС– индикаторная функция, равная 1, ΠΊΠΎΠ³Π΄Π° mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅, ΠΈ 0, ΠΊΠΎΠ³Π΄Π° Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚. Классом mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn обучСниСобозначаСтся Ρ„ΠΎΠ½ (Ρ‚.Π΅. отсутствиС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π² Ρ€Π΅Π³ΠΈΠΎΠ½Π΅).
mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn обучСниС– коэффициСнт, ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π½Ρ‹ΠΉ для балансирования Π²ΠΊΠ»Π°Π΄Π° ΠΎΠ±ΠΎΠΈΡ… loss-Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ Π² ΠΎΠ±Ρ‰ΠΈΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚. Π’ΠΎ всСх экспСримСнтах Π°Π²Ρ‚ΠΎΡ€ΠΎΠ² Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°, ΠΎΠ½, ΠΎΠ΄Π½Π°ΠΊΠΎ, Π±Ρ‹Π» Ρ€Π°Π²Π΅Π½ 1.

Авторы Ρ‚Π°ΠΊ ΠΆΠ΅ ΡƒΠΏΠΎΠΌΠΈΠ½Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ для ускорСния вычислСний Π² полносвязанном слоС ΠΎΠ½ΠΈ использовали Ρ€Π°Π·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρ‹ вСсов ΠΏΠΎ Truncated SVD.

Faster R-CNN

ПослС ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠΉ, сдСланных Π² Fast R-CNN, самым ΡƒΠ·ΠΊΠΈΠΌ мСстом нСйросСти оказался ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ Π³Π΅Π½Π΅Ρ€Π°Ρ†ΠΈΠΈ Ρ€Π΅Π³ΠΈΠΎΠ½ΠΎΠ²-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ². Π’ 2015 ΠΊΠΎΠΌΠ°Π½Π΄Π° ΠΈΠ· Microsoft Research смогла ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ этот этап Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π±ΠΎΠ»Π΅Π΅ быстрым. Они ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠΈΠ»ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡ‚ΡŒ Ρ€Π΅Π³ΠΈΠΎΠ½Ρ‹ Π½Π΅ ΠΏΠΎ ΠΈΠ·Π½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΌΡƒ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ, Π° ΠΎΠΏΡΡ‚ΡŒ ΠΆΠ΅ ΠΏΠΎ ΠΊΠ°Ρ€Ρ‚Π΅ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Ρ… ΠΈΠ· CNN. Для этого Π±Ρ‹Π» Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ ΠΌΠΎΠ΄ΡƒΠ»ΡŒ ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ Region Proposal Network (RPN). Новая Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° Ρ†Π΅Π»ΠΈΠΊΠΎΠΌ выглядит ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π’ Ρ€Π°ΠΌΠΊΠ°Ρ… RPN ΠΏΠΎ ΠΈΠ·Π²Π»Π΅Ρ‡Ρ‘Π½Π½Ρ‹ΠΌ CNN ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‚ Β«ΠΌΠΈΠ½ΠΈ-Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒΡŽΒ» с нСбольшим (3Ρ…3) ΠΎΠΊΠ½ΠΎΠΌ. ΠŸΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ с Π΅Ρ‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ значСния ΠΏΠ΅Ρ€Π΅Π΄Π°ΡŽΡ‚ΡΡ Π² Π΄Π²Π° ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹Ρ… полносвязанных слоя: box-regression layer (reg) ΠΈ box-classification layer (cls). Π’Ρ‹Ρ…ΠΎΠ΄Ρ‹ этих слоёв Π±Π°Π·ΠΈΡ€ΡƒΡŽΡ‚ΡΡ Π½Π° Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹Ρ… anchor-Π°Ρ…: k Ρ€Π°ΠΌΠΊΠ°Ρ… для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ полоТСния ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰Π΅Π³ΠΎ ΠΎΠΊΠ½Π°, ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ… Ρ€Π°Π·Π½Ρ‹Π΅ Ρ€Π°Π·ΠΌΠ΅Ρ€Ρ‹ ΠΈ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡ сторон. Reg-слой для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Ρ‚Π°ΠΊΠΎΠ³ΠΎ anchor-Π° Π²Ρ‹Π΄Π°Ρ‘Ρ‚ ΠΏΠΎ 4 ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Ρ‹, ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰Π΅ΠΉ Ρ€Π°ΠΌΠΊΠΈ; cls-слой Π²Ρ‹Π΄Π°Ρ‘Ρ‚ ΠΏΠΎ Π΄Π²Π° числа – вСроятности Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Ρ€Π°ΠΌΠΊΠ° содСрТит Ρ…ΠΎΡ‚ΡŒ ΠΊΠ°ΠΊΠΎΠΉ-Ρ‚ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ ΠΈΠ»ΠΈ Ρ‡Ρ‚ΠΎ Π½Π΅ содСрТит. Π’ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅ это ΠΈΠ»Π»ΡŽΡΡ‚Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ΡΡ Ρ‚Π°ΠΊΠΎΠΉ схСмой:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠŸΡ€ΠΎΡ†Π΅ΡΡ обучСния reg ΠΈ cls слоёв ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½Ρ‘Π½Π½Ρ‹ΠΉ; loss-Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡŽ ΠΎΠ½ΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΠ±Ρ‰ΡƒΡŽ, ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‰ΡƒΡŽ собой сумму loss-Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΠΈΠ· Π½ΠΈΡ…, с Π±Π°Π»Π°Π½ΡΠΈΡ€ΡƒΡŽΡ‰ΠΈΠΌ коэффициСнтом.

Оба слоя RPN Π²Ρ‹Π΄Π°ΡŽΡ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ прСдлоТСния для Ρ€Π΅Π³ΠΈΠΎΠ½ΠΎΠ²-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚ΠΎΠ². Π’Π΅ ΠΈΠ· Π½ΠΈΡ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ содСрТания ΠΊΠ°ΠΊΠΎΠ³ΠΎ-Π»ΠΈΠ±ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°, ΠΏΠ΅Ρ€Π΅Π΄Π°ΡŽΡ‚ΡΡ дальшС Π² ΠΌΠΎΠ΄ΡƒΠ»ΡŒ дСтСктирования ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΈ уточнСния ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰Π΅ΠΉ Ρ€Π°ΠΌΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΠΎ-ΠΏΡ€Π΅ΠΆΠ½Π΅ΠΌΡƒ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½ ΠΊΠ°ΠΊ Fast R-CNN.

Для Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ€Π°Π·Π΄Π΅Π»ΡΡ‚ΡŒ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΈ, ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌΡ‹Π΅ Π² CNN, ΠΌΠ΅ΠΆΠ΄Ρƒ RPN ΠΈ ΠΌΠΎΠ΄ΡƒΠ»Π΅ΠΌ дСтСктирования, процСсс обучСния всСй сСти построСн ΠΈΡ‚Π΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½ΠΎ, с использованиСм Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… шагов:

Mask R-CNN

Mask R-CNN Ρ€Π°Π·Π²ΠΈΠ²Π°Π΅Ρ‚ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρƒ Faster R-CNN ΠΏΡƒΡ‚Ρ‘ΠΌ добавлСния Π΅Ρ‰Ρ‘ ΠΎΠ΄Π½ΠΎΠΉ Π²Π΅Ρ‚ΠΊΠΈ, которая прСдсказываСт ΠΏΠΎΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ маски, ΠΏΠΎΠΊΡ€Ρ‹Π²Π°ΡŽΡ‰Π΅ΠΉ Π½Π°ΠΉΠ΄Π΅Π½Π½Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚, ΠΈ, Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ Ρ€Π΅ΡˆΠ°Π΅Ρ‚ ΡƒΠΆΠ΅ Π·Π°Π΄Π°Ρ‡Ρƒ instance segmentation. Маска прСдставляСт собой просто ΠΏΡ€ΡΠΌΠΎΡƒΠ³ΠΎΠ»ΡŒΠ½ΡƒΡŽ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ 1 Π½Π° Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ½ΠΎΡΡ‚ΡŒ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π΅Π³ΠΎ пиксСля ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρƒ Π·Π°Π΄Π°Π½Π½ΠΎΠ³ΠΎ класса, 0 β€” Ρ‡Ρ‚ΠΎ пиксСль ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρƒ Π½Π΅ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ‚.

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Визуализация Ρ€Π°Π·Π½ΠΎΡ†Π²Π΅Ρ‚Π½Ρ‹Ρ… масок Π½Π° исходных изобраТСниях ΠΌΠΎΠΆΠ΅Ρ‚ Π΄Π°Π²Π°Ρ‚ΡŒ красочныС ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠΈ:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Авторы Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π° условно Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‚ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½ΡƒΡŽ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρƒ Π½Π° CNN-ΡΠ΅Ρ‚ΡŒ вычислСния ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² изобраТСния, Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡƒΡŽ ΠΈΠΌΠΈ backbone, ΠΈ head β€” объСдинСниС частСй, ΠΎΡ‚Π²Π΅Ρ‡Π°ΡŽΡ‰ΠΈΡ… Π·Π° прСдсказаниС ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰Π΅ΠΉ Ρ€Π°ΠΌΠΊΠΈ, ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡŽ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π΅Π³ΠΎ маски. Loss функция для Π½ΠΈΡ… общая ΠΈ Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ Ρ‚Ρ€ΠΈ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Π°:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π’Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠ΅ маски происходит Π² class-agnostic стилС: маски ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ класса, Π±Π΅Π· ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ знания, Ρ‡Ρ‚ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΎ Π² Ρ€Π΅Π³ΠΈΠΎΠ½Π΅, ΠΈ ΠΏΠΎΡ‚ΠΎΠΌ просто выбираСтся маска класса, побСдившСго Π² нСзависимом классификаторС. УтвСрТдаСтся, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Π±ΠΎΠ»Π΅Π΅ эффСктивСн, Ρ‡Π΅ΠΌ ΠΎΠΏΠΈΡ€Π°ΡŽΡ‰ΠΈΠΉΡΡ Π½Π° Π°ΠΏΡ€ΠΈΠΎΡ€Π½ΠΎΠ΅ Π·Π½Π°Π½ΠΈΠ΅ класса.

Одна ΠΈΠ· основных ΠΌΠΎΠ΄ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΉ, Π²ΠΎΠ·Π½ΠΈΠΊΡˆΠΈΡ… ΠΈΠ·-Π·Π° нСобходимости ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ маску β€” ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ RoIPool(Π²Ρ‹Ρ‡ΠΈΡΠ»ΡΡŽΡ‰Π΅ΠΉ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Ρƒ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² для Ρ€Π΅Π³ΠΈΠΎΠ½Π°-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚Π°) Π½Π° Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡƒΡŽ RoIAlign. Π”Π΅Π»ΠΎ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ΠΊΠ°Ρ€Ρ‚Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², получСнная ΠΈΠ· CNN, ΠΈΠΌΠ΅Π΅Ρ‚ мСньший Ρ€Π°Π·ΠΌΠ΅Ρ€, Ρ‡Π΅ΠΌ исходноС ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅, ΠΈ Ρ€Π΅Π³ΠΈΠΎΠ½, ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰ΠΈΠΉ Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ цСлочислСнноС количСство пиксСлСй, Π½Π΅ получаСтся ΠΎΡ‚ΠΎΠ±Ρ€Π°Π·ΠΈΡ‚ΡŒ Π² ΠΏΡ€ΠΎΠΏΠΎΡ€Ρ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹ΠΉ Ρ€Π΅Π³ΠΈΠΎΠ½ ΠΊΠ°Ρ€Ρ‚Ρ‹ с цСлочислСнным количСством ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π’ RoIPool ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° Ρ€Π΅ΡˆΠ°Π»Π°ΡΡŒ просто ΠΎΠΊΡ€ΡƒΠ³Π»Π΅Π½ΠΈΠ΅ΠΌ Π΄Ρ€ΠΎΠ±Π½Ρ‹Ρ… Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ Π΄ΠΎ Ρ†Π΅Π»Ρ‹Ρ…. Π’Π°ΠΊΠΎΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΏΡ€ΠΈ Π²Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠΈ ΠΎΡ…Π²Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‰Π΅ΠΉ Ρ€Π°ΠΌΠΊΠΈ, Π½ΠΎ вычислСнная Π½Π° основС Ρ‚Π°ΠΊΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… маска получаСтся слишком Π½Π΅Ρ‚ΠΎΡ‡Π½ΠΎΠΉ.

Π’ ΠΏΡ€ΠΎΡ‚ΠΈΠ²ΠΎΠΏΠΎΠ»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ этому, Π² RoIAlign Π½Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ΠΎΠΊΡ€ΡƒΠ³Π»Π΅Π½ΠΈΠ΅, всС числа ΠΎΡΡ‚Π°ΡŽΡ‚ΡΡ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ, Π° для вычислСния Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ билинСйная интСрполяция ΠΏΠΎ Ρ‡Π΅Ρ‚Ρ‹Ρ€Ρ‘ΠΌ блиТайшим цСлочислСнным Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌ.

Π’ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½ΠΎΠΌ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π΅ Ρ€Π°Π·Π½ΠΈΡ†Π° поясняСтся Ρ‚Π°ΠΊΠΈΠΌ рисунком:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π—Π΄Π΅ΡΡŒ ΡˆΡ‚Ρ€ΠΈΡ…ΠΎΠ²Π°Π½Π½ΠΎΠΉ сСткой ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π΅Π½Π° ΠΊΠ°Ρ€Ρ‚Π° ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Π° Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠΉ β€” ΠΎΡ‚ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ Π½Π° ΠΊΠ°Ρ€Ρ‚Ρƒ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² Ρ€Π΅Π³ΠΈΠΎΠ½Π°-ΠΊΠ°Π½Π΄ΠΈΠ΄Π°Ρ‚Π° с исходной Ρ„ΠΎΡ‚ΠΎΠ³Ρ€Π°Ρ„ΠΈΠΈ. Π’ Π΄Π°Π½Π½Ρ‹ΠΉ Ρ€Π΅Π³ΠΈΠΎΠ½ Π΄ΠΎΠ»ΠΆΠ½ΠΎ ΠΏΠΎΠΏΠ°ΡΡ‚ΡŒ 4 Π³Ρ€ΡƒΠΏΠΏΡ‹ для max pooling ΠΏΠΎ 4 ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°, ΠΎΠ±ΠΎΠ·Π½Π°Ρ‡Π΅Π½Π½Ρ‹Ρ… Π½Π° рисункС Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ. Π’ ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠ΅ ΠΎΡ‚ ΠΏΡ€ΠΎΡ†Π΅Π΄ΡƒΡ€Ρ‹ RoIPool, которая Π·Π° счёт округлСния просто Π±Ρ‹ выровняла Ρ€Π΅Π³ΠΈΠΎΠ½ ΠΏΠΎ цСлочислСнным ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Π°ΠΌ, RoIAlign оставляСт Ρ‚ΠΎΡ‡ΠΊΠΈ Π² ΠΈΡ… Ρ‚Π΅ΠΊΡƒΡ‰ΠΈΡ… мСстах, Π½ΠΎ вычисляСт значСния ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΈΠ· Π½ΠΈΡ… ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ Π±ΠΈΠ»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ интСрполяции ΠΏΠΎ Ρ‡Π΅Ρ‚Ρ‹Ρ€Ρ‘ΠΌ блиТайшим ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ.

БилинСйная интСрполяция Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π΄Π²ΡƒΡ… ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… производится Π·Π° счёт примСнСния Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ интСрполяции сначала Π² Π½Π°ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΈ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚, Π·Π°Ρ‚Π΅ΠΌ β€” Π² Π΄Ρ€ΡƒΠ³ΠΎΠΉ.
ΠŸΡƒΡΡ‚ΡŒ Π½ΡƒΠΆΠ½ΠΎ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΠΎΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅Π² Ρ‚ΠΎΡ‡ΠΊΠ΅ P ΠΏΡ€ΠΈ извСстных значСниях Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Π² ΠΎΠΊΡ€ΡƒΠΆΠ°ΡŽΡ‰ΠΈΡ… Ρ‚ΠΎΡ‡ΠΊΠ°Ρ… mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅(см. рисунок Π½ΠΈΠΆΠ΅). Для этого Π²Π½Π°Ρ‡Π°Π»Π΅ ΠΈΠ½Ρ‚Π΅Ρ€ΠΏΠΎΠ»ΠΈΡ€ΡƒΡŽΡ‚ΡΡ значСния Π²ΡΠΏΠΎΠΌΠΎΠ³Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ‚ΠΎΡ‡Π΅ΠΊ R1 ΠΈ R2, Π° Π·Π°Ρ‚Π΅ΠΌ Π½Π° ΠΈΡ… основС интСрполируСтся Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π² Ρ‚ΠΎΡ‡ΠΊΠ΅ P.

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Помимо высоких Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… instance segmentation ΠΈ object detection, Mask R-CNN оказалась ΠΏΡ€ΠΈΠ³ΠΎΠ΄Π½ΠΎΠΉ для опрСдСлСния ΠΏΠΎΠ· людСй Π½Π° Ρ„ΠΎΡ‚ΠΎΠ³Ρ€Π°Ρ„ΠΈΠΈ (human pose estimation). ΠšΠ»ΡŽΡ‡Π΅Π²ΠΎΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚ здСсь β€” Π²Ρ‹Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Ρ‚ΠΎΡ‡Π΅ΠΊ (keypoints), Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ Π»Π΅Π²ΠΎΠ΅ ΠΏΠ»Π΅Ρ‡ΠΎ, ΠΏΡ€Π°Π²Ρ‹ΠΉ Π»ΠΎΠΊΠΎΡ‚ΡŒ, ΠΏΡ€Π°Π²ΠΎΠ΅ ΠΊΠΎΠ»Π΅Π½ΠΎ ΠΈ Ρ‚.ΠΏ., ΠΏΠΎ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΠΌΠΎΠΆΠ½ΠΎ Π½Π°Ρ€ΠΈΡΠΎΠ²Π°Ρ‚ΡŒ каркас ΠΏΠΎΠ·ΠΈΡ†ΠΈΠΈ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Для опрСдСлСния ΠΎΠΏΠΎΡ€Π½Ρ‹Ρ… Ρ‚ΠΎΡ‡Π΅ΠΊ Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‚ Ρ‚Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½Π° Π²Ρ‹Π΄Π°Π²Π°Π»Π° маски, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄ΠΈΠ½ пиксСль (Ρ‚Π° самая Ρ‚ΠΎΡ‡ΠΊΠ°) ΠΈΠΌΠ΅Π» Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ 1, Π° ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Π΅ β€” 0 (one-hot mask). Π’ Ρ‚ΠΎ ΠΆΠ΅ врСмя, ΡΠ΅Ρ‚ΡŒ трСнируСтся Π²Ρ‹Π΄Π°Π²Π°Ρ‚ΡŒ K Ρ‚Π°ΠΊΠΈΡ… ΠΎΠ΄Π½ΠΎΠΏΠΈΠΊΡΠ΅Π»ΡŒΠ½Ρ‹Ρ… масок, ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΉ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Ρ‚ΠΈΠΏΠ° ΠΎΠΏΠΎΡ€Π½ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠΈ.

Feature Pyramid Networks

Π’ экспСримСнтах ΠΏΠΎ Mask R-CNN, наряду с ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠΉ CNN ResNet-50/101 Π² качСствС backbone, Ρ‚Π°ΠΊΠΆΠ΅ ΠΏΡ€ΠΎΠ²ΠΎΠ΄ΠΈΠ»ΠΈΡΡŒ исслСдования цСлСсообразности использования Feature Pyramid Network (FPN). Они ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΈ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ FPN Π² backbone Π΄Π°Ρ‘Ρ‚ Mask R-CNN прирост ΠΊΠ°ΠΊ Π² точности, Ρ‚Π°ΠΊ ΠΈ Π² ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. Π­Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅Ρ‚ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΌ описаниС Ρ‚Π°ΠΊ ΠΆΠ΅ ΠΈ Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ, нСсмотря Π½Π° Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Π΅ΠΌΡƒ посвящён ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΉ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ ΠΈ с сСриСй рассматриваСмых статСй ΠΎΠ½ связан ΠΌΠ°Π»ΠΎ.
НазначСниС Feature Pyramids, ΠΊΠ°ΠΊ ΠΈ image pyramids, β€” ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΠ΅ качСства дСтСктирования ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² с ΡƒΡ‡Ρ‘Ρ‚ΠΎΠΌ большого Π΄ΠΈΠ°ΠΏΠ°Π·ΠΎΠ½Π° ΠΈΡ… Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠ².

Π’ Feature Pyramid Network ΠΊΠ°Ρ€Ρ‚Ρ‹ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², ΠΈΠ·Π²Π»Π΅Ρ‡Ρ‘Π½Π½Ρ‹Π΅ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ слоями CNN с ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°ΡŽΡ‰Π΅ΠΉΡΡ Ρ€Π°Π·ΠΌΠ΅Ρ€Π½ΠΎΡΡ‚ΡŒΡŽ, Ρ€Π°ΡΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°ΡŽΡ‚ΡΡ ΠΊΠ°ΠΊ нСкая иСрархичСская Β«ΠΏΠΈΡ€Π°ΠΌΠΈΠ΄Π°Β», называСмая bottom-up pathway. ΠŸΡ€ΠΈ этом ΠΊΠ°Ρ€Ρ‚Ρ‹ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈ Π½ΠΈΠΆΠ½ΠΈΡ…, ΠΈ Π²Π΅Ρ€Ρ…Π½ΠΈΡ… ΡƒΡ€ΠΎΠ²Π½Π΅ΠΉ ΠΏΠΈΡ€Π°ΠΌΠΈΠ΄Ρ‹ ΠΎΠ±Π»Π°Π΄Π°ΡŽΡ‚ своими прСимущСствами ΠΈ нСдостатками: ΠΏΠ΅Ρ€Π²Ρ‹Π΅ ΠΈΠΌΠ΅ΡŽΡ‚ высокоС Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅, Π½ΠΎ Π½ΠΈΠ·ΠΊΡƒΡŽ ΡΠ΅ΠΌΠ°Π½Ρ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ, ΠΎΠ±ΠΎΠ±Ρ‰Π°ΡŽΡ‰ΡƒΡŽ, ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ; Π²Ρ‚ΠΎΡ€Ρ‹Π΅ β€” Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

АрхитСктура FPN позволяСт ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒ достоинства Π²Π΅Ρ€Ρ…Π½ΠΈΡ… ΠΈ Π½ΠΈΠΆΠ½ΠΈΡ… слоёв ΠΏΡ€ΠΈ ΠΏΠΎΠΌΠΎΡ‰ΠΈ добавлСния top-down pathway ΠΈ lateral connections. Для этого ΠΊΠ°Ρ€Ρ‚Π° ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ Π²Ρ‹ΡˆΠ΅Π»Π΅ΠΆΠ°Ρ‰Π΅Π³ΠΎ слоя увСличиваСтся Π΄ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° Π½ΠΈΠΆΠ΅Π»Π΅ΠΆΠ°Ρ‰Π΅Π³ΠΎ ΠΈ ΠΈΡ… содСрТимоС поэлСмСнтно складываСтся. Π’ ΠΈΡ‚ΠΎΠ³ΠΎΠ²Ρ‹Ρ… прСдсказаниях ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ ΠΊΠ°Ρ€Ρ‚Ρ‹ всСх ΡƒΡ€ΠΎΠ²Π½Π΅ΠΉ.

Π‘Ρ…Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π½ΠΎ это ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°Π·ΠΈΡ‚ΡŒ Ρ‚Π°ΠΊ:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

Π£Π²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅ Ρ€Π°Π·ΠΌΠ΅Ρ€Π° ΠΊΠ°Ρ€Ρ‚Ρ‹ Π²Π΅Ρ€Ρ…Π½Π΅Π³ΠΎ уровня (upsampling) дСлаСтся самым простым ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ β€” nearest neighbor, Ρ‚. Π΅. ΠΏΡ€ΠΈΠ±Π»ΠΈΠ·ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Ρ‚Π°ΠΊ:

mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅. Π€ΠΎΡ‚ΠΎ mask r cnn ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠŸΠΎΠ»Π΅Π·Π½Ρ‹Π΅ ссылки

ΠžΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Ρ‹ с исслСдованиями Π½Π° arXiv.org:

На medium.com Π½Π° Ρ‚Π΅ΠΌΡƒ Mask R-CNN достаточно ΠΌΠ½ΠΎΠ³ΠΎ статСй, ΠΎΠ½ΠΈ Π»Π΅Π³ΠΊΠΎ находятся поиском. Π’ качСствС ссылок ΠΏΡ€ΠΈΠ²ΠΎΠΆΡƒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‚Π΅, Ρ‡Ρ‚ΠΎ довСлось ΠΏΡ€ΠΎΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ:

6. Simple Understanding of Mask RCNN β€” ΠΊΡ€Π°Ρ‚ΠΊΠΎΠ΅ ΠΈΠ·Π»ΠΎΠΆΠ΅Π½ΠΈΠ΅ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠΎΠ² Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚ΠΈΡ€ΡƒΡŽΡ‰Π΅ΠΉ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.

7. A Brief History of CNNs in Image Segmentation: From R-CNN to Mask R-CNN β€” история развития сСти Π² Ρ‚Π°ΠΊΠΎΠΌ ΠΆΠ΅ хронологичСском порядкС, ΠΊΠ°ΠΊ Π² Π΄Π°Π½Π½ΠΎΠΉ ΡΡ‚Π°Ρ‚ΡŒΠ΅.

8. From R-CNN to Mask R-CNN β€” Π΅Ρ‰Ρ‘ ΠΎΠ΄Π½ΠΎ рассмотрСниС этапов развития.

9. Splash of Color: Instance Segmentation with Mask R-CNN and TensorFlow β€” рСализация нСйросСти Π² Opensource-Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ΅ ΠΎΡ‚ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ Matterport.

ПослСдняя ΡΡ‚Π°Ρ‚ΡŒΡ ΠΏΠΎΠΌΠΈΠΌΠΎ описания ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠΎΠ² Mask R-CNN ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Π΅Ρ‚ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ ΡΠ΅Ρ‚ΡŒ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅: для Ρ€Π°ΡΠΊΡ€Π°ΡˆΠΈΠ²Π°Π½ΠΈΡ Ρ€Π°Π·Π½Ρ‹ΠΌΠΈ Ρ†Π²Π΅Ρ‚Π°ΠΌΠΈ Π²ΠΎΠ·Π΄ΡƒΡˆΠ½Ρ‹Ρ… ΡˆΠ°Ρ€ΠΎΠ² Π½Π° Ρ‡Ρ‘Ρ€Π½ΠΎ-Π±Π΅Π»Ρ‹Ρ… изобраТСниях.

Помимо этого, ΠΏΠΎΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠΎΠ²Π°Ρ‚ΡŒΡΡ с Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒΡŽ ΠΌΠΎΠΆΠ½ΠΎ Π½Π° Ρ‚ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ρ‡Ρ‚ΠΎ использовалась ΠΌΠ½ΠΎΠΉ Π² сорСвновании Data Science Bowl 2018 Π½Π° kaggle (Π½ΠΎ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ с ΠΎΠ΄Π½ΠΎΠΉ этой модСлью, разумССтся; Π² Ρ€Π°Π·Π΄Π΅Π»Π°Ρ… Kernels ΠΈ Discussions ΠΌΠΎΠΆΠ½ΠΎ Π½Π°ΠΉΡ‚ΠΈ ΠΌΠ½ΠΎΠ³ΠΎ всСго интСрСсного):

10. Mask R-CNN in PyTorch by Heng CherKeng. РСализация ΠΏΡ€Π΅Π΄ΠΏΠΎΠ»Π°Π³Π°Π΅Ρ‚ ряд шагов ΠΏΠΎ Ρ€Π°Π·Π²Ρ‘Ρ€Ρ‚Ρ‹Π²Π°Π½ΠΈΡŽ, ΠΈΠ½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΡŽ Π°Π²Ρ‚ΠΎΡ€ прСдоставляСт. МодСль Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ PyTorch 0.4.0, ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΡƒ GPU-вычислСний, NVIDIA CUDA. Если собствСнная систСма Π½Π΅ соотвСтствуСт трСбованиям, ΠΌΠΎΠ³Ρƒ ΠΏΠΎΡ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ±Ρ€Π°Π·Ρ‹ Deep Learning AMI для Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΠΎΠΊ Amazon (инстансы ΠΏΠ»Π°Ρ‚Π½Ρ‹Π΅, с почасовой Ρ‚Π°Ρ€ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠ΅ΠΉ, ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ подходящий Ρ€Π°Π·ΠΌΠ΅Ρ€, судя ΠΏΠΎ всСму, β€” p2.xlarge).

МнС Ρ‚Π°ΠΊΠΆΠ΅ попадалась здСсь, Π½Π° Ρ…Π°Π±Ρ€Π΅, ΡΡ‚Π°Ρ‚ΡŒΡ ΠΏΡ€ΠΎ использованиС сСти ΠΎΡ‚ Matterport Π² ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ΅ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΉ с блюдами (ΠΏΡ€Π°Π²Π΄Π°, Π±Π΅Π· исходников). НадСюсь, Π°Π²Ρ‚ΠΎΡ€ Π±ΡƒΠ΄Π΅Ρ‚ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ€Π°Π΄ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΌΡƒ ΡƒΠΏΠΎΠΌΠΈΠ½Π°Π½ΠΈΡŽ:

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *