Смотрите, чё нарыл.
Сей материал будет полезен:
1. тру-учёным, которым хочется чего-то новенького :)
2. айтишникам, которые пока являются лишь кодерами и хотят стать более глубокими специалистами в перспективной области.
3. гражданам, которые захотят освоить относительно новую и очень крутую специальность, недостаток профессионалов в которой только в США до 2018 года оценивается в 200 000 голов (с мозгами), а IBM уже с 2005 года вложила в эту сферу 20 млрд. долларов.
Как-то по совету хорошего друга я залез на бесплатные онлайн курсы от Массачусетского технологического института (к сожалению, на нашем Prometheus пока таких курсов нет. Но только пока :) ) https://www.edx.org/course/analytics-edge-mitx-15-... The Analytics Edge.
Теперь очень коротко и «на пальцах» шо воно таке (хотя просто советую уже лезть и смотреть):
1. Де-факто, Data Science или Datalogy изучает проблемы анализа, обработки и представления результатов. Говоря типа грамотным языком, это наука о том, как так анализировать информацию, чтобы компании или люди на основе такого анализа принимали более удачные решения и получали конкурентное преимущество на рынке.
2. Если раньше самым важным вопросом в конкуренции между странами/компаниями/людьми был сам факт получения какой-то важной инфы, то сейчас информации столько, что в ней можно запросто утонуть.
3. Потому нынче данные начали даже называть «второй нефтью», которую нужно научиться обрабатывать. Объём информации в мире оценивается в 2,7 зетабитов (гляньте в вики, сколько это). И тот, кто правильно проанализирует этот массив – тот и в выигрыше.
4. Самым простым примером множества данных и их анализа является этот наш фейсбучек – миллионы страниц с инфой про владельцев, их предпочтения и клики мышкой. И, на вскидку, анализ данных пользователей – это золотая жила для рекламных кампаний производителей.
5. Прогресс этой науки привёл к тому, что 4% американских супружеских пар возникли усилиями специальной электронной программы, которая грамотно анализировала данные анкет одиноких людей и выдавала рекомендации по созданию пар. Т.е. виртуальный «он» видел в вариантах не всех меганфоксов и кристинагиллер, а нормальных человеческих женщин, которые подходили бы ему по психотипу и увлечениям. Аналогично было сделано и для женской половины аудитории. Сей шаг повышал количество первых удачных свиданий и уменьшал вероятность разочарований и «замыканий в себе».
6. Конечно, по моему мнению, самым интересным опытом анализа большого массива данных является продолжающийся эксперимент по выявлению причин заболеваний сердца, начатый ещё в 1948 году. Многолетний анализ большого количества показателей огромного числа пациентов привел к тому, что факты «высокое давление требует лечения» и «курение приводит к сердечно-сосудистым заболеваниям» стали сами собой разумеющимися, а смертность от сердечных заболеваний в США снизилась на 60%.
7. Но интересно ещё вот что. В Интернете полно массивов данных в открытом доступе. Например, Всемирная организация здравоохранения по всем 194 странам мира публикует информацию о смертности, рождаемости, грамотности, количестве детей, посещающих школу и т.п. А Министерство сельского хозяйства США выкладывает информацию о составе более 7000 продуктов питания по 16 показателям (белки, жиры, углеводы, витамины, микро- и макрокомпоненты). Т.е. прослушав даже только первый блок из этого курса Вы самостоятельно сможете планировать свой рацион и по приколу рассматривать зависимость ВВП стран от рождаемости. Или наоборот.
В общем, я надеюсь, что донёс Вам в нулевом приближении ту мысль, что современная информационная «нефть» буквально плещется под ногами и неплохо будет, если Вы научитесь её «брать», анализировать и «продавать» результаты анализа конторам, которым этот анализ нужен.
Особенности курса:
1. Для того, чтобы стать профи в этом деле постепенно нужно будет осваивать матаппарат. Регрессии, логарифмы и аппроксимации – наше всё.
2. Мало того, придётся освоить язык R. Он под анализ данных и заточен, хотя многим учёным он чем-то напомнит старый добрый Origin.
И, смею заметить, что для тех, кто прошёл курс http://courses.prometheus.org.ua/courses/KPI/Progr... – прохождение курса по анализу данных будет намного проще.
Из плюсов:
1. Бесплатность.
2. Это курс от MIT.
3. Курс на английском языке. Для тех, кто не владеет – там идёт расшифровка. Гугл-транслейт (или что там ещё у кого есть) в помощь.
4. Как и во всех нормальных онлайн курсах – методика «от простого-к сложному без понтов».
В общем, пробуйте.
Я считаю, что чем большее число людей будут владеть основами анализа данных – тем лучше будет всем. Даже в целом — Украине.
Это хорошая прививка от возможного популизма и допинг для развития мозга.
И вообще. Вы должны понимать, что современный глобальный мир, онлайн образование и английский язык снимают для Вас практически любые рамки в том, чтобы стать почти кем угодно.
Единственные рамки – это собственная лень.