Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Михаил Васильев (Cтарший специалист по машинном...

Михаил Васильев (Cтарший специалист по машинному обучению) Поиск аномалий в данных. Алгоритмы iForest и PCA

Во втором докладе про поиск аномалий мы продолжим изучение наиболее популярных методов, сосредоточившись на Isolation Forest и PCA. Я объясню «на пальцах» как работают эти методы, а также, какие у них сильные и слабые стороны.

Видео: https://moscowpython.ru/meetup/101/iforest-pca/

Moscow Python: http://moscowpython.ru
Курсы Learn Python: http://learn.python.ru
Moscow Python Podcast: http://podcast.python.ru
Заявки на доклады: https://bit.ly/mp-speaker

Avatar for Moscow Python Meetup

Moscow Python Meetup

April 23, 2025
Tweet

More Decks by Moscow Python Meetup

Other Decks in Programming

Transcript

  1. Обо мне • Старший специалист по машинному обучению • deep

    learning engineer • NLP, CV, anomaly detection • Open source contributor • Выпускник и амбассадор Яндекс Практикума • Выпускник DLS ФПМИ МФТИ
  2. попугаи удавы 3.248357 -2.874754 2.930868 -2.826776 3.323844 -3.340012 3.761515 -2.883873

    2.882923 -2.853464 2.882932 -3.357176 3.789606 -2.067113 … … индекс аномальности -0.119150 -0.131275 -0.108670 -0.065472 -0.128972 -0.120056 -0.012170 …
  3. Методы $ pip install pyod from pyod.models.iforest import IForest clf

    = IForest() clf.fit(data) scores = clf.decision_scores_
  4. Методы $ pip install pyod [1] Fei Tony Liu, Kai

    Ming Ting, and Zhi-Hua Zhou. Isolation forest. In Data Mining, 2008. ICDM'08. Eighth IEEE International Conference on, 413–422. IEEE, 2008. [2] Liu, Fei Tony, Ting, Kai Ming and Zhou, Zhi-Hua. “Isolation-based anomaly detection.” ACM Transactions on Knowledge Discovery from Data (TKDD) 6.1 (2012): 3. [3] Mei-Ling Shyu, Shu-Ching Chen, Kanoksri Sarinnapakorn, and LiWu Chang. A novel anomaly detection scheme based on principal component classifier. Technical Report, MIAMI UNIV CORAL GABLES FL DEPT OF ELECTRICAL AND COMPUTER ENGINEERING, 2003.
  5. In [1]: import random In [2]: axes = ['попугаи', 'удавы']

    In [3]: random.choice(axes) Out[3]: 'удавы' In [4]: random.uniform(-6.0, 6.0) Out[4]: 3.954197818641566