Кластерный анализ графиков. Основы и рыночные примеры.

Кластерный анализ графиков. Основы и рыночные примеры. Аналитика
Содержание
  1. Формальное описание задач кластеризации
  2. Что такое кластерный анализ
  3. Обзор: основы кластерного анализа
  4. Алгоритмы (общее)
  5. Вероятностные меры сходства
  6. Дополнительная информация
  7. Достоинства
  8. Другие бинарные меры
  9. Другие методы
  10. Зарплаты
  11. Измерение близости объектов
  12. Изучаем кластерный график шаг за шагом.
  13. Как правильно интерпретировать кластерные значения
  14. Классификация вакансий
  15. Кластеризация
  16. Кластерный анализ и интерпретация дельта показателей
  17. Математические характеристики кластера
  18. Меры близости
  19. Меры предсказуемости
  20. Меры расстояния
  21. Меры сходства
  22. Метрика
  23. На каких валютах возможно использовать кластерный анализ?
  24. Неоднозначность задачи кластерного анализа
  25. Переключение графика на кластеры.
  26. Признаки
  27. Примеры торговли
  28. Расстояние
  29. Резюме кластерного анализа
  30. Решение задачи кластерного анализа
  31. Слабые стороны
  32. Стандартизация
  33. Торговля с помощью кластерного анализа

Формальное описание задач кластеризации

Дано множество объектов данных I, каждый из которых представлен набором атрибутов. Требуется построить множество кластеров C и отображение F множества I на множество C, т.е. F: I → C. Отображение F задает модель данных, являющуюся решением задачи.
Множество I определим следующим образом:

I={i1,i2,…,in}{displaystyle I={i_{1},i_{2},…,i_{n}}}

где ij{displaystyle i_j},- исследуемый объект.
Каждый из объектов характеризуется набором параметров:

ij={x1,x2,…,xh,…,xm}{displaystyle i_j={x_1,x_2,…,x_h,…,x_m}}

Каждая переменная xh{displaystyle x_h} может принимать значения из некоторого множества:

xh={x1,x2,…,xh,…,xm}{displaystyle x_h={x_1,x_2,…,x_h,…,x_m}}

Задача кластеризации состоит в построении множества:

C={c1,c2,…,ck,…cg}Здесь<math>ck{displaystyle C={c_1,c_2,…,c_k,…c_g}
Здесь <math>c_k}
– кластер, содержащий похожие друг на друга объекты из множества I:
ck={ij,ip|ij∈I,ip∈I,d(ij,ip)<σ{displaystyle c_k={i_{j},i_p | i_j in I, i_p in I, d(i_j,i_p)<sigma }

где σ – величина, определяющая меру близости для включения объектов в один кластер; d(ij,ip){displaystyle d(i_j,i_p )} – мера близости между объектами, называемая расстоянием.

Что такое кластерный анализ

Кластерный анализ – это сравнительно молодое направление анализа графика ицены. Как известно, до 2004 года информация об объемах на горизонтальных ценовых уровнях была недоступна для трейдеров. С появлением такой возможности были разработаны специализированные компьютерные программы, позволяющие трейдеру оценивать формирование торговых объемов, а также разницу между ордерами на покупку и продажу внутри баров и использовать эту информацию в торговле.

Сделать кластерный анализ объема за определенный период времени, значит заглянуть внутрь свечи определенного временного интервала и посмотреть, как в ней формировался объем. Т.е. заглянув вовнутрь свечи, мы можем определить, какое количество объема было куплено или продано по конкретной цене.

График отображает детальную информацию о покупателях и продавцах. На рынке всегда есть покупатели и продавцы, и торговый процесс — это столкновение противоположных интересов: продавец хочет продать дороже, а покупатель — купить как можно дешевле. И когда они сходятся на определенном ценовом уровне, устраивающем обе стороны, они заключают сделку по текущей цене — другими словами, создают тик, который мы привыкли видеть на графике.

Мы можем наблюдать на кластерном графике следующую информацию:

  • ценовой диапазон свечи (например 1,2217-1,2225)
  • объем в количестве проторгованных контрактов по конкретной цене
  • объем прошедший по цене ask
  • объем прошедший по цене bid
  • дельту (объем прошедший по цене ask- объем прошедший по цене bid)
  • общий объем свечи (отображается внизу, как мы привыкли в МТ4)
  • профиль объёма с количеством проторгованных контрактов  по каждой цене.

Обзор: основы кластерного анализа

Кластерный анализ

– ацкая вундервафля в мире трейдинга, дающая трейдеру 20 к торговому скилу и 80 к ЧСВ.

На практике позволяет в некоторой степени заглянуть внутрь каждого бара и увидеть творящееся там безобразие. Разумеется, сделки, которые теперь может видеть трейдер, не перестают быть обезличенными, а потому по прежнему нет возможности понять, кто конкретно и с какой целью ее совершил, но по ряду косвенных признаков можно прояснить для себя картинку рыночной ситуации.

К сожалению, нет никакой возможности запихнуть огромный учебный курс в одну обзорную статью, поэтому ниже я покажу лишь самые простые и рабочие вещи, которые можно взять на вооружение уже завтра.

Кому будет полезен кластерный анализ?

Скальперу. Непосредственно, как основной сигнал для работы. При определенных условиях и хорошем понимании кластерного графика можно минимизировать стоплос вплоть до 2-3 пунктов (по четырехзнаку).

Интрадейщику. Для лучшего понимания общей картинки рынка и подтверждения своих рабочих сетапов.

Важные моменты.

1. Кластера имеют смысл только при наличии биржевых данных, где каждая сделка видна всем другим участникам рынка (если иное не указано в спецификации). Поэтому торговать по кластерам лучше всего там же, откуда берется информация. Например, при торговле валютами, лучше всего торговать фьючерс, а не спот.
2. Кластерный анализ лучше всего работает на сверхликвидных и сверх спекулятивных инструментах: золото, нефть, 6e, 6b. Неплохо заходит также канадский доллар. При торговле акциями, лучше торговать именно более спекулятивный фьючерс на акции.
3. Крайне желательно видеть сам момент формирования кластеров. Например, есть большая разница между большим кластером в 1000 контрактов, который сформировался 1-2 тиками и таким же кластером, который последовательно накидывали в течении 1 минуты периодически отскакивая и возвращаясь к области. Это разные совершенно ситуации и отрабатывать их нужно по разному. Анализируя график постфактум вы урезаете ровно половину полезной информации.
4. График всегда первичен. Кластерный анализ это не Грааль. Работает он только в строго определенном контексте и не всегда согласуется с тем, что мы видим на графике. В этом случае предпочтение следует отдавать более традиционным методам анализа.

Графическое представление.

Есть довольно много шаблонов для кластерного анализа написанных для разных платформ. Различаются в основном:
1. Удобством графического восприятия и работы.
2. наличием деления свечи по бид/аск.
3. Наличием профиля объема.
4. Скоростью работы (обновления данных).

Последнее особенно важно, так как отдельные ушлые конторы типа популярной народной “Кластер дельты” распараллеливали данные своего кривого фида на много потоков. В результате чего, конечные пользователи могли получать обновление не чаще, чем раз в 4 секунды да и те с задержкой. Для профессиональной и особенно алгоритмической торговли это никуда не годится.

Название: 111.jpg
Просмотров: 850

Размер: 219.0 КБ

Мне самому нравится шаблон под нинзя-трейдер. Основные преимущества:
1. Бесплатный.
2. График легко маштабируется и скролится.
3. Активные участки рынка выражены профилем и цветом. Это очень удобно для восприятия и работы. Шаблон можно скачать в архиве.

Название: cl5.jpg
Просмотров: 846

Размер: 177.1 КБ

Общие принципы.

Для начала стоит понимать простейшее распределение объема в свече.

1. Разгон – торможение.
Объем на графике бывает двух типов. Трейдеры либо тормозят движение фиксируя прибыль и переворачиваясь, либо трейдеры разгоняют движение пробиваясь через важные уровни. Расположение объема внутри свечи подскажет, что происходит.
Почему именно так? А какой дурак будет покупать после того, как цена отмахала верх среднестатистический АТР? Крупные деньги так не работают.

Название: obem1.jpg
Просмотров: 831

Размер: 15.4 КБ

То есть, в большинстве случаев рост объема это близкая остановка. Иногда на спокойном рынке можно вообще ориентироваться только на него. Например.

Название: 1212.jpg
Просмотров: 851

Размер: 490.8 КБ

2. Защита диапазона. Если цена стоит в области аккумуляции и пока нет поводов для выхода цены будьте уверены, кластерный график вам покажет, как именно защищают этот самый коридор.

Название: protect.jpg
Просмотров: 841

Размер: 40.9 КБ

Простые торговые приемы.

Внимание, для того, чтобы внятно оценивать мелькающие на экране циферки требуется довольно много попа-часов проведенных у монитора. К сожалению, невозможно описать тонкие нюансы работы в статье. Тем не менее, ниже я постарался перечислить и показать самые простые приемы которые даже новичок в трейдинге может использовать в своей торговле после минимальной практики.

1. Остановка/разворот/защита. Такой паттерн встречается очень часто. На графике в моменте проскакивает непропорционально большой объем в моменте, который резко разворачивает цену. (Агрессивный игрок поставил “плиту”.) В дальнейшем идет ретест этой же области уже без объема. (никто не хочет пробивать, продавливать мощный уровень). Цена идет туда, куда легче двигаться. На графике это выглядит как классический патерн 1-2-3-хук.

Нажмите на изображение для увеличения
Название: retest.jpg
Просмотров: 112
Размер:	227.2 КБ
ID:	2843256

2. Последовательность объемных накоплений. Всем знакомые дивергенции находят свое непосредственное отражение и на кластерных графиках. Часто бывает, что рынок против ожиданий, против всех технических формаций, против фундаментальных данных и вообще здравого смысла растет планомерно формируя волну за волной. Трейдеры-торопыги не понимают, что происходит и спешно закрывают свои позиции. Трейдеры-иланщики истребляют все доступные запасы валерьяны и уже не надеются на разворот. Трейдеры-трендовики наконец видят “мощный” тренд, в который обязательно надо зайти! А на деле… А на деле, кто-то большой и сильный в это время формирует позицию продавая против тренда и удерживая цену от преждевременного падения. В преддверии важных новостей (о которых конечно же никто не знает заранее, ага) цену просто тащат туда, где можно максимально выгодно купить/продать.

Название: volna.jpg
Просмотров: 835

Размер: 155.5 КБ

3. Видит ли рынок ваш уровень. Это то, что работает каждый день. Есть простое правило. Любой уровень на графике существует лишь в вашем воображении до тех пор, пока рынок не доказал обратное. Смысл в том, что уровни на графике при желании можно проводить хоть каждые 5 пунктов. Горизонтальные, наклонные, объемные, расчетные, индикаторные, скользящие и т.д. Весь график можно разлинеить. В этом смысле, кластера покажут видит ли ваш уровень кто-нибудь кроме вас. Обычно всплеск объема идет непосредственно перед и во время касания уровня.

Название: eur1.jpg
Просмотров: 845

Размер: 247.0 КБ

Пример ложного пробоя.

Нажмите на изображение для увеличения
Название: 21d30-clip-64kb.png
Просмотров: 60
Размер:	52.2 КБ
ID:	2843261

4. Объем на одной конкретной котировке на нескольких свечах подряд. Здесь сидит лимитный игрок и роботом набирает нужный объем. В дальнейшем эта зона часто работает, как уровень.

Название: obem5.jpg
Просмотров: 834

Размер: 164.8 КБ

5. Отсутствие интереса. Пустой объем. Бывает перед новой волной движения по тренду. Пустой объем на определенной котировке показывает, что здесь уже никто не хочет торговать. Одна из сторон сделки самоустранилась и движение вот-вот начнется.

Название: minimal.jpg
Просмотров: 844

Размер: 88.0 КБ

P.S. Статья будет обновляться и дополнятся по мере сил.

Алгоритмы (общее)

Большинство популярных алгоритмов, решающих задачу кластеризации, используют в качестве формата входных данных матрицу отличия D. Строки и столбцы матрицы соответствуют элементам множества I. Элементами матрицы являются значения d(ij,ip){displaystyle d(i_j,i_p)} в строке j и столбце p. Очевидно, что на главной диагонали значения будут равны нулю:

D=(0d(e1,e2)d(e1,en)d(e2,e1)0d(e2,en)d(en,e1)d(en,e2)0){displaystyle D = begin{pmatrix} 0 & d(e_1,e_2) & d(e_1,e_n) \ d(e_2,e_1) & 0 &d(e_2,e_n) \ d(e_n,e_1) & d(e_n,e_2) & 0 end{pmatrix} }

Решение задачи кластеризации принципиально неоднозначно, и тому есть несколько причин:

  1. Не существует однозначно наилучшего критерия качества кластеризации. Известен целый ряд эвристических критериев, а также ряд алгоритмов, не имеющих чётко выраженного критерия, но осуществляющих достаточно разумную кластеризацию ”по построению“. Все они могут давать разные результаты.
  2. Число кластеров, как правило, неизвестно заранее и устанавливается в соответствии с некоторым субъективным критерием.
  3. Результат кластеризации существенно зависит от метрики, выбор которой, как правило, также субъективен и определяется экспертом.

Вероятностные меры сходства

Вероятностные меры пригодны лишь для бинарных данных.

Мера сходства Кулсински (2), принимающая значения от 0 до 1, вычисляется как:

K2=aa b aa c2{displaystyle K2 = frac {frac{a}{a b} frac{a}{a c}}{2} }

Мера сходства Снита и Сокала (4), принимающая значения от 0 до 1, определяется по формуле:

Дополнительный анализ:  ООО "ПТК-Аналитик" предлагает лабораторные услуги для частных лиц

SS4=aa b aa c db d dc d4{displaystyle SS4 = frac{frac{a}{a b} frac{a}{a c} frac{d}{b d} frac{d}{c d}}{4}}

Мера сходства Хаманна, определенная на интервал [-1; 1], имеет вид:

HAMANN=(a d)−(b c)a b c d{displaystyle HAMANN = frac{(a d)-(b c)}{a b c d}}

Дополнительная информация

Еще хочу обратить внимание, что если при возврате цены к пробойному месту, где были крупные кластера, нет нужной реакции, не появляются объемы и цена довольно легко проходит это место, то скорее всего это был ложный вынос для сбора стопов и получения необходимой ликвидности.

На схеме это выглядит так, обычно это может появляться на значимых и исторических уровнях и возле хороших уровневых наторговок:

Вот пример из ниндзи:

Ниже мы видим, что можно провести уровни, подтвержденные объемом, и получить зону сопротивления, которая впоследствии была пробита. При возврате цены нет ни крупных кластеров, ни остановки цены в месте пробоя. Поэтому можно предположить, что произошел захват ликвидности на стопах покупателей и тех, кто входил на пробой уровня.

Вот еще пример, где захват произошел буквально одной свечой:

После данного ложного движения мы могли наблюдать очень хорошее внутридневное движение с хорошим соотношением sl/tp.

Не стоит забывать, что анализ входа в данном случае делается по фьючерсу евро (6E), а фьючерс – это  производный финансовый инструмент, стандартный срочный биржевой контракт купли-продажи базового актива, при заключении которого стороны (продавец и покупатель) договариваются только об уровне цены и сроке поставки.

Остальные параметры актива (количество, качество, упаковка, маркировка и т. п.) оговорены заранее в спецификации биржевого контракта. Стороны несут обязательства перед биржей вплоть до исполнения фьючерса. Контракты евро имеют статус расчетные, с поставками в марте, в июне, в сентябре и в декабре.

Котировки фьючерса и форекс спота всегда отличаются. Особенно когда осуществляется переход на новый контракт, то разница в котировках может составлять до 50п., она со временем уменьшается до 10-15 п. Хочу обратить внимание, что при анализе входа нужно обращать внимание не на конкретный ценовой уровень, а на структуру движения инструмента в целом, потому что она, как правило, повторяется.

Достоинства

Большое достоинство кластерного анализа в том, что он позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков. Кроме того, кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов, и позволяет рассматривать множество исходных данных практически произвольной природы.

Это имеет большое значение, например, для прогнозирования конъюнктуры, когда показатели имеют разнообразный вид, затрудняющий применение традиционных эконометрических подходов.
Кластерный анализ позволяет рассматривать достаточно большой объем информации и резко сокращать, сжимать большие массивы социально-экономической информации, делать их компактными и наглядными.

Важное значение кластерный анализ имеет применительно к совокупностям временных рядов, характеризующих экономическое развитие (например, общехозяйственной и товарной конъюнктуры). Здесь можно выделять периоды, когда значения соответствующих показателей были достаточно близкими, а также определять группы временных рядов, динамика которых наиболее схожа.

Кластерный анализ можно использовать циклически. В этом случае исследование производится до тех пор, пока не будут достигнуты необходимые результаты. При этом каждый цикл здесь может давать информацию, которая способна сильно изменить направленность и подходы дальнейшего применения кластерного анализа.

Другие бинарные меры

Коэффициент Охиай:

OCHIAI=(aa b)(aa c){displaystyle OCHIAI = sqrt{(frac{a}{a b})(frac{a}{a c})} }

Мера сходства Снита и Сокала (5):

SS5=ad(a b)(a c)(b d)(c d){displaystyle SS5 = frac{ad}{sqrt{(a b)(a c)(b d)(c d)}}}

Корреляция четырех точек (аналог коэффициента Пирсона):

PHI=ad−bc(a b)(a c)(b d)(c d){displaystyle PHI = frac{ad-bc}{sqrt{(a b)(a c)(b d)(c d)}}}

Дисперсия меры сходства:

DISPER=ad−bc(a b c d)2{displaystyle DISPER = frac{ad-bc}{(a b c d)^2} }

Другие методы

На странице

хорошо продемонстрированы различные алгоритмы кластеризации. GMM — единственный, который дал хорошие результаты.


Остальные алгоритмы либо не работали, либо давали очень скромные результаты.

Из реализованных мной, хорошие результаты были в двух случаях:

  1. Выбирались точки с большой плотностью в некоторой окрестности, стоящие на удаленном расстоянии друг от друга. Точки становились центрами кластеров. Далее на основе центров начинался процесс формирования кластеров — присоединение соседних точек.
  2. Агломеративная кластеризация — итерационное слияние точек и кластеров. В библиотеке scikit-learn этот вид кластеризации представлен, но работает плохо. В своей реализации я менял матрицу соединений после каждой итерации слияния. Процесс останавливался по достижению некоторых граничных параметров — по факту дендрограммы не помогают понять процесс слияния, если кластеризуются 1500 элементов.

Зарплаты

Зарплаты указаны только в 261 (22%) вакансии из 1167 попавших в кластеры.

При расчете зарплат:

  1. Если указывался диапазон «от … и до …», то использовалось среднее значение
  2. Если указывалось только «от …» или только «до …», то это значение и бралось
  3. При расчетах использовалась(или приводились) ЗП после уплаты налогов (NET)


На графике:

  1. Кластеры идут в порядке убывания медианной зарплаты
  2. Вертикальная черта в коробке — медиана
  3. Коробка — диапазон [Q1, Q3],  где Q1 (25%) и Q3 (75%) перцентили. Т.е. в коробку попадают 50% зарплат
  4. В «усы» попадают зарплаты из диапазона [Q1 — 1.5*IQR, Q3 1.5*IQR], где IQR = Q3 — Q1 — интерквартильный размах
  5. Отдельные точки — аномалии, не попавшие в усы. (Есть аномалии не попавшие и на диаграмму)

Измерение близости объектов

Проблема измерения близости объектов неизбежно возникает при любых трактовках кластеров и различных методах классификации.

Отметим основные трудности, возникающие при этом: неоднозначность выбора способа нормировки и определения расстояния между объектами. Рассмотрим результаты небольшого обследования. Студенты группы записывают свои данные (вес, рост), оформляют в таблицу и строят по ним корреляционное поле. Масштабы по осям выбираются произвольно (рис.1.1).

На рис.1.1а выделяются классы A – девушки, B – юноши. На рис. 1.1b выделяются классы A1 (юноши и девушки) и B1(часть юношей). Класс юношей C (пунктирная линия) на рис. 1.1б не выделит, поскольку расстояния между ближайшими объектами классов A1 и B1 существенно больше, чем внутренние расстояния в A1, юноши из A почти никакими алгоритмами к B1 не присоединяются.

Однако определить расстояние между объектами в данном случае нельзя, поскольку признаки измерены в разных единицах измерения. Требуется нормировка показателей, переводящая их в безразмерные величины: тогда измерение близости объектов становится оправданным.

В кластерном анализе для количественной оценки сходства вводится понятие метрики. Сходство или различие между классифицируемыми объектами устанавливается в зависимости от метрического расстояния между ними. Если каждый объект описывается k признаками, то он может быть представлен как точка в k-мерном пространстве, и сходство с другими объектами будет определяться как соответствующее расстояние.

Расстоянием (метрикой) между объектами в пространстве параметров называется такая величина dab{displaystyle d_{ab}}, которая удовлетворяет аксиомам:

A1. dab>0,dab=0{displaystyle d_{ab}>0, d_{ab}=0 }
A2. dab=dba{displaystyle d_{ab}=d_{ba} }
A3. dab dbc≥dac{displaystyle d_{ab} d_{bc} ge d_{ac} }

Мерой близости (сходства) обычно называется величина μab{displaystyle μ_{ab}}, имеющая предел и возрастающая с возрастанием близости объектов.

B1. μab{displaystyle mu_{ab}} непрерывна
B2. μab=μba{displaystyle mu_{ab}=mu_{ba} }
B3. 1≤μab≥0{displaystyle 1 le mu_{ab} ge 0 }

Существует возможность простого перехода от расстояний к мерам близости: μ=11 d{displaystyle mu = frac {1}{1 d} }.

Изучаем кластерный график шаг за шагом.

Давайте начнём изучение кластеров шаг за шагом. Опираемся на скриншот ниже и шаг за шагом следим за ходом мыслей:

выход лонгистов кластерный график
Выход лонгистов для снижение цены

На графике с отображением бид-аск, при ретесте (обведённый маркером кластер), есть две значимых ячейки. Тот пункт, что на уровне 21 922, вероятнее всего отработал отложенным ордером на продажу, т.к. во-первых, сам уровень значимый, во-вторых, пик кластера.

Вряд ли получилось бы такое соотношение между бид и аск, на вершине кластера – 0 к 121 (к тому же мы держим в голове действующий флэт плотности лимитных заявок). В данной ситуации, ещё за мгновение до ретеста, кто-то из опытных участников рынка вовремя подсуетился и выставил (а возможно и выставилИ), отложенный ордер Sell Stop на уровне 21 922.

В дальнейших секундах, по мере снижения цены, очевидно, другие трейдеры подхватили данное развитие событий, запрыгнув в тронувшийся паровоз, допустив типичные ошибки большинства. Тем самым ещё больше подкинув дровишек в топку парораспределительного механизма… На чуть нижерасположенной ячейке, красного цвета на продажу видно, тоже не равномерное распределение спроса и предложения.

Дельта это разница между объёмом сделок, прошедших по цене бид и аск. Грубо говоря (примитивно) между покупками и продажами.

Как правильно интерпретировать кластерные значения

Перед вами скриншот графика с периодом М1, с продолжительным нисходящим движением. Наша с вами задача, разобраться, а вернее изучить данную ситуацию на активе фьючерса на Сбербанк. Надо отметить, что такое падение на тайм фрейме М1, это очень неординарный случай. То есть 250 пунктов практически за 45 минут, для данного инструмента, я бы назвал редчайшим падением.

Совет! Не используйте кластерный график постоянно, из-за сложности анализа, вам будет трудно. Включайте его только в важных моментах. Например у уровней.

Итак, красным прямоугольником отмечена область, в которой, как мне кажется, мы с вами найдём ключ для разгадки, что же спровоцировало такое падение. Согласитесь, с помощью отображения японских свечей довольно проблематично искать зацепку на данном участке.

Единственное что мы можем констатировать, это факт выхода ценой из баланса. Но это бы мы поняли в режиме реального времени, пройдя уже около 75 пунктов. То есть нам опять пришлось бы запрыгивать в уходящий поезд, отдавая рынку львиную долю потенциального заработка.

Так же на скриншоте японских свечей, непосредственно перед падением, мы видим ретест области. К сожалению больше никаких подсказок нам не видно на данном отображении графика. Теперь, для более тщательного анализа и полноты информации, давайте переключимся на кластерный график с отображением объёмов.

Классификация вакансий

Кластеризацию можно было сделать гораздо проще, не прибегая к сложным математическим моделям: составить топ наименований вакансий, и разбить их по группам. Далее анализировать каждую группу на топ n-грамм, и средние зарплаты. Не нужно выделять признаки и присваивать им веса.

Такой подход хорошо бы работал (в какой-то мере) для запроса «Python». А вот для запроса «Программист 1С» такой подход работать не будет, т.к. для программистов 1С в наименовании вакансий редко указывают конфигурации 1С или прикладные направления. А направлений где используется 1С много: бухгалтерия, расчет ЗП, расчет налогов, расчет себестоимости на производственных предприятиях, складской учет, бюджетирование, ERP системы, розничная торговля, управленческий учет, и т.д.

Для себя я вижу две задачи по анализу вакансий:

  1. Понять, где используется язык программирования, о котором я мало знаю (как в этой статье).
  2. Фильтровать новые опубликованные вакансии.
Дополнительный анализ:  Цифровая АЭС — это уже не фантастика

Для решения первой задачи подходит кластеризация, для решения второй — разнообразные классификаторы, случайные леса, деревья принятия решений, нейронные сети. Тем не менее мне захотелось оценить пригодность выбранной модели для задачи классификации вакансий.

Если использовать встроенный в sklearn.mixture.GaussianMixture метод predict(), то ничего хорошего не получается. Большинство вакансий он относит к большим кластерам, а два кластера из первых трех являются неинформативными. Я использовал другой подход:

  1. Берем вакансию, которую хотим классифицировать. Векторизуем ее и получаем точку в нашем пространстве.
  2. Рассчитываем расстояние от этой точки до всех кластеров. Под расстоянием между точкой и кластером я принял среднее расстояние от этой точки до всех точек кластера.
  3. Кластер с наименьшим расстоянием и является предсказанным классом для выбранной вакансии. Расстояние до кластера указывает надежность такого предсказания.
  4. Для увеличения точности модели я выбрал расстояние 0.87 как пороговое, т.е. если расстояние до ближайшего кластера больше 0.87, то модель не классифицирует вакансию.

Для оценки модели случайным образом отобраны 30 вакансий из тестового набора. В колонке вердикт:

N/a: модель не классифицировала вакансию (расстояние > 0.87) : правильная классификация-: неправильная классификация  


Итого: на 12 вакансиях нет результата, на 2 вакансиях — ошибочная классификация, на 16 вакансиях — правильная классификация. Полнота модели — 60%, точность модели — 89%.

Кластеризация

В качестве алгоритма кластеризации была выбрана модель

Gaussian Mixture Model (GMM)

. Алгоритм получает на вход данные в виде векторов, и параметр n_components — число кластеров, на которые надо разбить множество. О том, как работает алгоритм, можно посмотреть

(на английском языке). Я использовал готовую реализацию GMM из библиотеки scikit-learn:

Отмечу, что GMM не использует метрику, а делает разделение данных только по набору признаков и их весам. В статье расстояние Жаккара используется для визуализации данных, подсчета компактности кластеров (за компактность я принял среднее расстояние между точками кластера), и определения центральной точки кластера (типичная вакансия) — точка с наименьшим средним расстоянием до других точек кластера.

В предыдущем разделе на глаз было определено, что кластеров скорей всего будет шесть. Так выглядят результаты кластеризации при n_components = 6:

На рисунке с выводом кластеров по отдельности, кластеры располагаются в порядке убывания числа точек слева направо, сверху вниз: кластер 4 — самый большой, кластер 5 — самый маленький. В скобках для каждого кластера указана его компактность.

На вид кластеризация получилась не очень хорошей, даже если учитывать, что алгоритм t-SNE не идеален. При анализе кластеров результат тоже не обрадовал.

Для нахождения оптимального числа кластеров n_components, воспользуемся критериями AIC и BIC, о которых можно прочитать здесь. Расчет данных критериев встроен в метод sklearn.mixture.GaussianMixture. Так выглядит график критериев:

При n_components = 12 критерий BIC имеет наименьшее (наилучшее) значение, критерий AIC тоже имеет значение близкое к минимуму (минимум при n_components = 23). Произведем разделение вакансий на 12 кластеров:

Теперь кластеры имеют более компактные формы, как на вид, так и в числовом выражении. При ручном анализе вакансии оказались разбиты на характерные группы для понимания человека. На рисунке выведены названия кластеров. Кластеры под номерами 11 и 4 помечены как и :

  1. В кластере 11 все признаки имеют приблизительно одинаковые суммарные веса.
  2. Кластер 4 выделен по признаку Java. Тем не менее вакансий на должность Java Developer в кластере мало, часто знание Java требуется как «будет дополнительным плюсом».

Кластерный анализ и интерпретация дельта показателей

Как упоминалось выше, дельта это разница между бидом и аском, спросом и предложением, покупателями и продавцами. Так, на выше расположенном скриншоте, мы наблюдаем отрицательную дельту. Можно ли сказать, что после формирования этой дельты, цена устремилась вниз?

Несомненно, можно. Но так же можно допустить, что эта дельта наоборот приостановила цену, при подъёме наверх. К сожалению, на истории мы этого не узнаем. Увы, мы не в курсе того, что было первоочередным, подъём или спуск. Или цена вообще 3-5 раз дёргалась туда-сюда. Но мы здесь о том и говорим, что в режиме реального времени, нам было бы в разы проще понимать концепцию движений.

Но как бы там не было, мы с вами нашли и разобрали очаг возгорания огромного нисходящего движения. Понимаете, ведь нам нужно было лишь убедиться в отношении объёмов между быками и медведями. Это важно при выходе ценой из баланса.

Математические характеристики кластера

Кластер имеет следующие математические характеристики: центр, радиус, среднеквадратическое отклонение, размер кластера.
Центр кластера – это среднее геометрическое место точек в пространстве переменных.
Радиус кластера – максимальное расстояние точек от центра кластера.

Кластеры могут быть перекрывающимися. Такая ситуация возникает, когда обнаруживается перекрытие кластеров. В этом случае невозможно при помощи математических процедур однозначно отнести объект к одному из двух кластеров. Такие объекты называют спорными.

Спорный объект – это объект, который по мере сходства может быть отнесен к нескольким кластерам.
Размер кластера может быть определен либо по радиусу кластера, либо по среднеквадратичному отклонению объектов для этого кластера.

Меры близости

Существует четыре вида мер близости: меры расстояния, меры сходства, меры предсказуемости вероятностные коэффициенты сходства. Каждый из этих видов имеет свои достоинства и недостатки, которые следует рассматривать прежде, чем будет принято решение использовать какие-либо из них.

Когда необходимо установить сходство между объектами, описываемыми бинарными переменными, применяются коэффициенты ассоциативности. Удобнее рассматривать эти коэффициенты, обратившись к таблице ассоциативности, в которой связь между объектами представлена в виде наличия и отсутствия признаков.

В таблице наличие и отсутствие признака для объекта 1 и объекта 2 обозначаются 1 и 0, соответственно; a – число случаев, когда у обоих объектов присутствует признак; d – число случаев, когда признак отсутствует у объектов; b и c – когда признак есть у одного объекта и его нет у другого.

Меры предсказуемости

Коэффициент Лямбда Гудмана и Крускала дает оценку предсказуемости состояния характеристик на один объект (наличие или отсутствие) заданного состояния на другой объект. Лямбда изменяется от 0 до 1 и вычисляется по формуле:

t1=max(a,b) max(c,d) max(a,c) max(b,d){displaystyle t_1 = max(a,b) max(c,d) max(a,c) max(b,d)}
t2=max(a b,b d) max(a b,c d){displaystyle t_2 = max(a b, b d) max(a b, c d)}
LAMBDA=t1−t22(a b c d)−t2{displaystyle LAMBDA = frac{t_1-t_2}{2(a b c d)-t_2}}

Коэффициент D Андерберга вычисляет уменьшение ошибки подобия, когда один объект применяется для прогнозирования другого объекта. D изменяется от 0 до 1 и определяется как:

t1=max(a,b) max(c,d) max(a,c) max(b,d){displaystyle t_1 = max(a,b) max(c,d) max(a,c) max(b,d)}
t2=max(a b,b d) max(a b,c d){displaystyle t_2 = max(a b, b d) max(a b, c d)}
D=t1−t22(a b c d){displaystyle D = frac{t_1-t_2}{2(a b c d)}}

Коэффициент Q Юла:

Q=ad−bcad bc{displaystyle Q = frac{ad-bc}{ad bc}}

Этот коэффициент равен нулю, если признаки независимы и может принимать значение 1, только когда bc = 0, т.е. в случае полной связности, а значение −1, только когда ad = 0, т.е. в случае полной отрицательной связности.

Коэффициент Y Юла изменяется от -1 до 1 и вычисляется по формуле:

y=ad−bcad bc{displaystyle y = frac{sqrt{ad}-sqrt{bc}}{sqrt{ad} sqrt{bc}} }

Меры расстояния

  • Бинарное евклидово расстояние имеет минимальное значение – 0, максимальное – не определено. Вычисляется по формуле:
BEUCLID=b c.{displaystyle BEUCLID=sqrt {b c}.}
  • Если необходимо придать большие веса более отдаленным друг от друга объектам, используется квадрат бинарного евклидова расстояния:
BSEUCLID=b c{displaystyle BSEUCLID=b c }
SIZE=(b−c)2(a b c d)2{displaystyle SIZE = frac{(b-c)^2}{(a b c d)^2}}
PATTERN=bc(a b c d)2{displaystyle PATTERN = frac{bc}{(a b c d)^2}}
BSHAPE=(a b c d)−(b−c)2(a b c d)2{displaystyle BSHAPE = frac {(a b c d)-(b-c)^2}{(a b c d)^2}}
VARIANCE=b c4(a b c d){displaystyle VARIANCE = frac {b c}{4(a b c d)}}
  • Бинарная неметрическая мера различия Ланса и Вильямса:
BLWMN=b c2a b c{displaystyle BLWMN = frac {b c}{2a b c}}

Меры сходства

Простой коэффициент совстречаемости имеет вид

S=a d(a b c d)′{displaystyle S = frac{a d}{(a b c d)^prime}}

где S – сходство между двумя объектами, которое меняется в пределах от 0 до 1. Этот коэффициент учитывает также и одновременное отсутствие признака у обоих объектов (как указано в клетке d матрицы ассоциативности). Поэтому некоторые объекты оказываются в значительной степени схожими главным образом за счет того, что им обоим не свойственны признаки, а не за счет наличия общих характеристик.

Коэффициент Жаккара, определенный следующим образом

J=a(a b c)′{displaystyle J = frac{a}{(a b c)^prime} }

не учитывает одновременного отсутствия признака при вычислении сходства (клетка не d рассматривается). Он изменяется от 0 до 1. В противоположность коэффициенту совстречаимости коэффициент Жаккара принимает в расчет лишь те признаки, которые характерны хотя бы для одного из объектов.

Мера сходства Рассела и Рао, определенная как бинарное скалярное произведение, вычисляется по формуле:

RR=a(a b c d){displaystyle RR = frac {a}{(a b c d)} }

Мера сходства Дайса:

DICE=2a(2a b c){displaystyle DICE = frac{2a}{(2a b c)}}

Мера сходства Снита и Сокала (1):

SS1=2(a d)2(a d) b c{displaystyle SS1 = frac{2(a d)}{2(a d) b c}}

Мера сходства Снита и Сокала (2):

SS2=aa 2(b c)){displaystyle SS2 = frac{a}{a 2(b c))}}

Мера сходства Снита и Сокала (3):

SS3=a bb c{displaystyle SS3 = frac{a b}{b c}}

Мера сходства Роджерса и Танимато:

RT=a da d 2(b c){displaystyle RT = frac{a d}{a d 2(b c)}}

Мера сходства Кулсински (1):

K1=ab c{displaystyle K1 = frac{a}{b c} }

Метрика

Для работы с данными нужно иметь представление о них. В нашем случае хотелось бы увидеть, есть ли какие-то скопления точек, которые мы и будем считать кластерами. Для этого я использовал алгоритм

t-SNE

, чтобы перевести все векторы в двухмерное пространство. 

Суть метода в том, чтобы понизить размерность данных, при этом максимально сохранить пропорции расстояний между точками множества.  Понять по формулам, как работает t-SNE довольно сложно. Но мне понравился один пример найденный где-то на просторах интернета: допустим у нас есть шарики в трехмерном пространстве.

Каждый шарик мы соединяем со всеми остальными шариками невидимыми пружинами, которые никак не пересекаются и не мешают друг другу при пересечении. Пружины действуют в две стороны, т.е. они сопротивляются как отдалению, так и приближению шариков друг к другу.

Система находится в стабильном состоянии, шарики неподвижны. Если мы возьмем один из шариков и оттянем его, а затем отпустим — то за счет силы пружин он вернется в исходное состояние. Далее мы берем две большие пластины, и сжимаем шарики в тонкий слой, при этом не мешая шарикам двигаться в плоскости между двумя пластинами.

Начинают действовать силы пружин, шарики перемещаются и в итоге останавливаются, когда силы всех пружин становятся уравновешенными. Пружины будут действовать так, что шарики, которые находились близко друг к другу, останутся относительно близко и на плоскости.

Алгоритм t-SNE использовался мною только для визуализации множества точек. Он помог выбрать метрику, а также подбирать весы для признаков.

Если использовать метрику Евклида, которую мы используем в нашей повседневной жизни, то расположение вакансий будет выглядеть следующим образом:

Дополнительный анализ:  Вакансия Старший кредитный аналитик (Малый бизнес) в Москве, работа в компании Сбер для экспертов (вакансия в архиве c 18 сентября 2020)

На рисунке видно, что большинство точек сосредоточены в центре, и есть небольшие ответвления в стороны. При таком подходе алгоритмы кластеризации, использующие расстояния между точками, ничего хорошего выдавать не будут.

Существует большое множество метрик (способов определения расстояния между двумя точками), которые будут хорошо работать на исследуемых данных. Я выбрал в качестве меры расстояние Жаккара, с учетом весов n-грамм. Мера Жаккара простая для понимания, при этом хорошо работает для решения рассматриваемой задачи.

Пример:
Вакансия 1 содержит n-граммы: «на python», «sql», «docker»
Вакансия 2 содержит n-граммы: «на python», «sql», «php»
Веса:
«на python» — 8
«sql» — 5
«docker» — 7
«php» — 9
Пересечение множеств (n-грамма встречается в 1-ой и 2-ой вакансии):  «на python», «sql» = 8 5 = 13
Объединение множеств (все n-граммы из 1-ой и 2-ой вакансии):  «на python», «sql», «docker», «php» = 8 5 7 9 = 29
Расстояние =1 — (Пересечение множеств / Объединение множеств) = 1 — (13 / 29) = 0.55

Была вычислена матрица расстояний между всеми парами точек, размер матрицы 1595 х 1595. Всего 1 271 215 расстояний между уникальными парами. Среднее расстояние получилось равным 0.96, между 619 659 расстояние равно 1 (т.е. сходства нет совсем). Следующая диаграмма показывает, что в целом вакансии имеют мало сходства:

При использовании метрики Жаккара наше пространство теперь выглядит так:

Появились четыре ярко выраженных участка плотности, и два маленьких скопления с небольшой плотностью. По крайней мере, так видят мои глаза!

На каких валютах возможно использовать кластерный анализ?

Сразу хочу заметить, что не на все валюты есть фьючи для анализа, так что те, кто любят торговать экзотику, не смогут найти все требуемые котировки. Ниже список и кодировка фьючерсных контрактов на валюты, доступные в ниндзе:

Также стоит отметить, что на фьючах все валюты являются базовыми в котировке, и в данном случае доллар рассматривается по отношению к другим валютам. Поэтому при анализе фьючерсов на валюты следует это учитывать. Вот пример:

Это доллар/канадец на форексе и канадец/доллар на фьючерсах. Аналогичное явление и с японской йеной.

Неоднозначность задачи кластерного анализа

Неоднозначность данной задачи может быть устранена экспертом или аналитиком. Работа кластерного анализа опирается на два предположения. Первое предположение –
рассматриваемые признаки объекта в принципе допускают желательное разбиение пула (совокупности) объектов на кластеры.

Второе предположение – правильность выбора масштаба или единиц измерения признаков.
Выбор масштаба в кластерном анализе имеет большое значение. Рассмотрим пример. Представим себе, что данные признака х в наборе данных А на два порядка больше данных признака у: значения переменной х находятся в диапазоне от 100 до 700, а значения переменной у – в диапазоне от 0 до 1.

Тогда, при расчете величины расстояния между точками, отражающими положение объектов в пространстве их свойств, переменная, имеющая большие значения, т.е. переменная х, будет практически полностью доминировать над переменной с малыми значениями, т.е. переменной у.

Переключение графика на кластеры.

Мы видим, что большинство максимальных объёмов сконцентрировались в верхних частях кластеров. О чём нам это говорит? Если вернёмся к нашим японским свечам, то мы обратим внимание на центральную область красного прямоугольника. По опыту могу утверждать, что именно в центральной части прямоугольника, расположены лимитные заявки на продажу, более-менее, крупных участников рынка.

Кластерный анализ пытается найти следы крупных игроков на графике. Это происходит за счёт (чаще всего) анализа прошедших крупных заявок.

Видите, примерно посередине красного прямоугольника есть скопление максимальных объёмов – здесь были лимитники на продажу. Я смею предположить, что «последней каплей» стал объём размером в 121 контракт, при ретесте области. К тому же он сформировался на том же ценовом уровне 21 922, что и объём в кластере чуть поодаль, со значением в 219 контрактов.

Признаки


По тексту загруженных вакансий были сформированы две группы наиболее часто встречающихся

n-грамм

слов:

  • 2-граммы на кириллице и латинице
  • 1-граммы на латинице

В вакансиях IT ключевые навыки и технологии обычно пишутся на английском языке, поэтому вторая группа включала слова только на латинице.

После отбора n-грамм первая группа содержала 81 2-граммы, а вторая 98 1-граммы:


Разбиение вакансий на кластеры было решено сделать по следующим критериям в порядке приоритета:

Определение к какой группе критериев относится n-грамма, и какой

вес

ей присвоить, происходило на интуитивном уровне. Приведу пару примеров:

  1. С первого взгляда «Docker» можно отнести ко второй группе критериев с весом от 4 до 6. Но упоминание «Docker» в вакансии, скорей всего говорит о том, что вакансия будет на должность «DevOps инженер». Поэтому «Docker» попал в первую группу и получил вес равный 7.
  2. «Java» тоже попадает в первую группу, т.к. в большинстве рассматриваемых вакансий с присутствием слова «Java» ищут Java-разработчика с пунктом «будет дополнительным преимуществом знание Python». Бывают и вакансии с поиском «человека-оркестра». Как первые, так и вторые вакансии меня не интересуют, поэтому их я хочу отделить от остальных вакансий, соответственно присваиваю «Java» наибольший вес 9.

Чем больше вес у n-граммы — тем сильней будут группироваться вакансии по данному признаку.

Примеры торговли

Как мы видим на скрине ниже (6E-фьючерс евро), был слом тенденции с формированием объемного накопления после пробоя, далее идет движение вниз и последующий возврат к объемной зоне, где начинают появляться крупные кластера. Здесь мы ищем вход с довольно небольшим стоп-лоссом.

Ниже то же самое место в МТ4. Мы видим, что данный вход обоснован имеющимися объемами, и стоп поставлен не просто, а спрятан за объемные зоны, и если там находится действующий продавец, то он будет защищать зону своего входа, что дает нам статистическое преимущество более чем 50/50.

Вот паттерн на покупку:

Еще один пример отработки сигнала на продажу:

Расстояние

Неотрицательное значение d(ij,ip){displaystyle d(i_j,i_p ) } называется расстоянием между элементами ij{displaystyle i_j } и ip{displaystyle i_p}, если выполняются следующие условия:

  1. (ij,ip)≥0{displaystyle (i_j,i_p )ge 0}, для всех ij{displaystyle i_j} и ip{displaystyle i_p}
  2. d(ij,ip)=0{displaystyle d(i_j,i_p )=0}, тогда и только тогда, когда ij=ip{displaystyle i_j= i_p}.
  3. d(ij,ip)=d(ip,ij){displaystyle d(i_j,i_p )=d(i_p,i_j )}.
  4. d(ij,ip)≥d(ij,ir) d(ir,ip){displaystyle d(i_j,i_p )ge d(i_j,i_r ) d(i_r,i_p )}. Если расстояние d(ij,ip){displaystyle d(i_j,i_p)} меньше некоторого значения σ, то говорят, что элементы близки и помещаются в один кластер. В противном случае говорят, что элементы отличны друг от друга и их помещают в разные кластеры.

Резюме кластерного анализа

Итак, резюмируем эффективность кластерного анализа, с признанием фишек технического анализа. В данной сложившейся ситуации на рынке, «глобального» нисходящего движения фьючерса на Сбербанк, загибаем пальцы: Плотность отложенных ордеров в виде флэта, выход ценой из баланса, ретест областей, инициативная сделка, максимальные объёмы на верхних частях кластеров, правильно-истинная интерпретация бид-аск значений, обнаружение Sell Stop ордера и выявление значимой дельты.

По факту, в этой ситуации мы нащупали 8 признаков активности продавцов. Пять, из которых являются частью анализа по Футпринт, т.к. анализ кластеров, это один из подвидов футпринта. Но мы с вами тщательно разобрали кластерный анализ, а посему я смею предположить, что читатели этого материала довольно чётко впитали азы кластерного анализа.

Уважаемые начинающие трейдеры, изучайте всю «подноготную» ордеров, объёмов, психологии трейдинга и сферу рынка в целом, в рубрике Азбука Трейдера. И только в таком случае у вас появится шанс не бороться с ценой, а брать, что вам даёт рынок!

Эта статья – материал из рубрики “Азбука Трейдинга”. Загляните в неё. Там ещё много интересного!

Сложно?“Трейдинг для чайников” – бесплатное обучение рынкам.

Решение задачи кластерного анализа

Решением задачи кластерного анализа являются разбиения, удовлетворяющие некоторому критерию оптимальности. Этот критерий может представлять собой некоторый функционал, выражающий уровни желательности различных разбиений и группировок, который называют целевой функцией. Например, в качестве целевой функции может быть взята внутригрупповая сумма квадратов отклонения:

W=σn=∑j=1n(xj−x¯)=∑j=1nxj2−1n(∑j=1nxj)2{displaystyle W = sigma_n = sum^{n}_{j=1} {(x_j – bar {x})} = sum^{n}_{j=1} {x_j^2}-frac{1}{n} (sum^n_{j=1} {x_j})^2}
где xj{displaystyle x_{j}}– представляет собой измерения j-го объекта

Слабые стороны

Первая проблема — возьмем две вакансии:

Вакансия 1 — «Ведущий программист C »
«Требования:

  • Опыт разработки на C от 5-ти лет.
  • Дополнительным плюсом будет знание Python»

Вакансия 2 — «Ведущий программист Python»
«Требования:

  • Опыт разработки на Python от 5-ти лет.
  • Дополнительным плюсом будет знание C »

С точки зрения модели эти вакансии идентичны. Я пробовал корректировать веса признаков на порядок их нахождения в тексте. Ни к чему хорошему это не привело.

Вторая проблема — GMM кластеризует все точки множества, как и многие алгоритмы кластеризации. Неинформативные кластеры сами по себе не являются проблемой. Но и информативные кластеры содержат выбросы. Впрочем, это легко решается очисткой кластеров, например удалением самых нетипичных точек, которые имеют наибольшее среднее расстояние до остальных точек кластера.

Стандартизация

Стандартизация (standardization) или нормирование (normalization) приводит значения всех преобразованных переменных к единому диапазону значений путем выражения через отношение этих значений к некой величине, отражающей определенные свойства конкретного признака. Существуют различные способы нормирования исходных данных:

z=x−x¯σ,z=xxmax,z=x−x¯xmax−xmin{displaystyle z = frac{x-bar{x}}{sigma}, z=frac{x}{x_{max}}, z=frac{x-bar{x}}{x_{max}-x_{min}}}

где x¯,σ{displaystyle bar{x},sigma}- соответственно среднее и среднеквадратическое отклонение x,xmax,xmin{displaystyle x,x_{max},x_{min}} – наибольшее и наименьшее значение x .

Наряду со стандартизацией переменных, существует вариант придания каждой из них определенного коэффициента важности, или веса, который бы отражал значимость соответствующей переменной. В качестве весов могут выступать экспертные оценки, полученные в ходе опроса экспертов – специалистов предметной области.

Полученные произведения нормированных переменных на соответствующие веса позволяют получать расстояния между точками в многомерном пространстве с учетом неодинакового веса переменных.
В ходе экспериментов возможно сравнение результатов, полученных с учетом экспертных оценок и без них, и выбор лучшего из них.

Торговля с помощью кластерного анализа

Для получения максимальной прибыли нужно уметь определить переход дельты из умеренного уровня в нормальный. Ведь в этом случае можно заметить само начало перехода от флета к трендовому движению и суметь получить наибольшую прибыль.
Более наглядным является кластерный график на нём можно увидеть значимые уровни накопления и распределения объемов, построить уровни поддержки и сопротивления.

Это позволяет трейдеру найти точный вход в сделку.
Используя дельту, можно судить о преобладании на рынке продаж или покупок. Кластерный анализ позволяет наблюдать сделки и отслеживать их объёмы внутри бара любого ТФ. Особо это важно при подходе к значимым уровням поддержки или сопротивления. Суждения по кластерам – ключ к пониманию рынка.

Видео о настройке и торговле в ATAS по кластерам (футпринт).

Оцените статью
Аналитик-эксперт
Добавить комментарий

Adblock
detector