Анализ блога Ильи Бирмана. Часть 3: визуализация.

В двух предыдущих заметках я рассказал, как собирал данные и приводил базовый анализ на самые-самые заметки:

  1. Сбор данных.
  2. Анализ данных.
  3. Визуализация.

Доступные данные

Скрипт собрал данные о 4565 заметках. По каждой есть: заголовок, дата, длина, количество картинок, просмотры, комментарии, тэги и ссылка на саму заметку.

Первые заметки в блоге датированы 2002 годом, последняя заметка — от 26 сентября 2019. Активность в 2002-2004 годах отличается от последующих: два месяца в 2002 (заметки импортированы в 2005), ещё восемь супер-активных месяцев в 2003, чуть менее бурная активность в 2004. С 2005 года и дальше более-менее равномерно.

Общий вид

Первое, что заметил — это стабильность Ильи: за всё время не было ни периодов тишины, ни каких-то взрывов активности.

Напоминает концепцию «20-мильного марша» из книги «Великие по собственному выбору». Авторы книги нашли общую особенность у великих людей и компаний: они выбирали темп и всегда его придерживались. В неблагоприятных условиях это закаляло дисциплину, а в хороших — удерживало от неконтролируемого роста.

Эту регулярность можно увидеть на тепловой карте ниже. Слева количество заметок в каждый месяц из 17 лет, а справа — средняя длина заметки.

Чтобы видеть выбросы, за «среднее» брал именно арифметическое среднее, а не медиану.

в 2003 году Илья писал в блог по 2-3 заметки в день или 365 заметок за 7 месяцев

Аналитика уровня «пальцем в небо»: заметны относительно спокойные периоды и хочется найти в закономерность. Илья часто путешествует, а в путешествиях обычно столько всего интересного, что времени на блог остаётся меньше. Предположу, что «спокойные периоды» блога связаны именно с путешествиями: февраль..апрель и август..сентябрь в 2019, август в 2017, декабрь 2016..январь 2017.

Заметна тенденция: чем больше постов за месяц, тем больше их средняя длина. То есть Илья обычно пишет либо коротко и немного, либо и много, и длинно. Эту корреляцию можно увидеть на диаграмме рассеяния.

Динамику по годам количества заметок и их длины видно на диаграмме «ящик с усами»:

в 2019 в среднем заметки стали короче, но стало больше очень длинных заметок — «выбросов»

Интересные детали

Просмотры начали считаться с января 2018. Видимо, в это время движок блога научился их считать и показывать. На более ранних заметках счётчик просмотров может отсутствовать или показывать единицы просмотров.

На графике видны «выбросы» — месяцы с аномально высокими просмотрами. Заметки с самыми большими просмотрами я приводил в предыдущей заметке об анализе блога.
Вот они:

год просмотры тэги
О запятой после «С уважением» 2006 87974 русский язык
Переплата по кредиту 2013 39296 жизнь, общество, экономика
Числа π и e 2012 14387 математика
Война 2015 13601 красная таблетка, общество
Почему люди платят налоги 2014 9310 красная таблетка, общество, философия, экономика

Комментарии. До 2012 заметки в блоге набирали большое количество комментариев, а с января 2012 они почти исчезли. Потом появлялись только для отдельных заметок.

общее количество комментариев за месяц

Заметки после 2012 года с наибольшим количеством комментариев:

В предыдущих сериях

  1. Cбор данных: заметка и код на ГитХабе
  2. Анализ данных: заметка и код на ГитХабе
Share
Send
Pin
 19   1 mon   Python   Накодил   Сделал
Popular