Это раньше я был злой, потому что у меня велосипеда не было, как сказал бы в моём случае почтальон Печкин. А теперь, согласно очевидной шутке, я ненавижу и автомобилистов, и пешеходов, потому что купил себе подержанный велосипед.
Author: Kirill
Как пьют кофе в Италии
Италия известна своим пристрастием к кофе. Задумайся над словами «капучинно», «эспрессо», «латте» (кстати на итальянском это значит — молоко). Нормальный день любого итальянца начинается с чашечки «кафэ нормале», как его тут называют. Обычное дело для обычного итальянца забежать в небольшую кофейню-бар с утра и выпить чашечку этого самого обыкновенного кофе, которое мы привыкли называть «эспрессо». Выпить, чтобы затем дальше побежать по своим делам, потому что без кофе утром и вина вечером нельзя представить жизнь здесь.
Машинное обучение, анализ данных — это следующая индустриальная революция
Я много пишу про анализ данных или про большие данные. Но многие из моих друзей имеют весьма смутное представление о том, что это такое и почему это так круто.
Анализ данных — это то, почему вы видите похожие товары, когда покупаете что-нибудь в интернет-магазине. Это то, почему лучшие сайты оказываются на первой странице гугла. Благодаря им, авиакомпании могут делать скидки на билеты, потому что понимают, что спрос на них падает. Благодаря машинному обучению можно предсказать, сколько человек придёт на выборы, какая команда выиграет матч или даже беременность по изменившемуся списку еженедельных покупок.
Как правительство должно развивать предпринимательство и инновации
Предпринимательство и предпринимательская культура в России отсталые. И даже не в смысле отсталые, от культуры UK или США, а в смысле, умственно отсталые, у нас их просто нет. У нас есть потрясающие люди, которые, как всегда, делают всё вопреки, а не благодаря. Конечно, есть замечательные программы поддержки молодых коммерсантов (например, можно получить около 300 тысяч рублей в виде региональной субсидии на открытие бизнеса; можно вполне официально, будучи безработным получить субсидию на открытие бизнеса, которая складывается из пособия по безработицы, которое человек мог бы получить), есть большая и красивая куча бабла, которую назвали ФРИИ, и которая, быть может, даже принесёт какую-нибудь пользу.
Шпаргалка как придумать новую идею
Это перевод шикарного поста Джеймса Альтушера про то, как придумывать новые идеи. У нас переводили его записи про то, как начать новую жизнь (оригинал на ТехКранче), или как стать мастером в любом деле.
Лучший способ придумать новые идеи — это находиться крайне близко к провалу. Навык генерирования новых идей очень похож на прокачку мускулатуры. Ты растёшь только тогда, когда берёшь за более тяжёлые веса.
В реальной жизни, когда к твоему виску приставлен пистолет, ты либо срочно придумываешь что тебе делать, или ты умираешь.
Стоит тебе порезаться, ты начинаешь буквально фонтанировать идеями. Если у тебя не осталось ни рубля и ты снова близок к тому, чтобы кушать ролтон, ты начинаешь придумывать новые идеи.
Если ты разрушил свою жизнь, ты просто обязан придумать какой-то способ построить её заново.
Предсказание количества лайков. Сравнение несколько регрессионных алгоритмов.
В начале апреля я узнал о суперкрутом конкурсе SNA Hackaton. К сожалению, узнал я лишь за неделю, но и для того, чтобы принять в нём участие, надо было доделать более важные дела. Суть конкурса в том, что участникам выдавался небольшой (~500 МБ) набор данных, содержащий текст поста в Одноклассниках, его время, идентификатор и идентификатор группы, а также собранные им лайки.
Надо было построить такой алгоритм, который лучше всего предскажет количество лайков, которое наберёт какой-либо другой пост. Это вполне возможно сделать, обучив алгоритм на имеющихся данных, потому что вся необходимая информация уже есть в них. Как оказалось потом, на количество лайков влияет длина поста, его содержание, наличие фотографий и другие параметры.
Честно сказать, результатом пары бессонных ночей я доволен и не доволен одновременно. С одной стороны, хочется сказать спасибо организаторам за то, что дали такую прекрасную возможность проанализировать данные и построить и проверить все эти гипотезы. Благодаря этому конкурсу я немного больше узнал про SciKit-learn и NLP (Natural Language Processing, а не то, что вы подумали). Но с другой стороны, у меня появилось желание получить модель получше, которое я пока, к сожалению, не реализовал.
Поскольку блог сжимает оригинальный html файл, посмотреть результаты исследования можно и с нормальной версткой.
…
Статистическая модель для определения перспективных отраслей инвестиционного фонда
Давече я наткнулся на интересный пост в Фейсбуке, в котором просили построить модель для определения интересных отраслей для инвестирования денег. И поскольку лет через 15, когда я вырасту большим и сильным, я буду работать в венчурном фонде, а также мне очень нравится заниматься анализом данных, я решил немного подумать над тем, как эти отрасли можно определять. Но поскольку, вопреки утверждению папы дяди Фёдора, с ума всё-таки лучше сходить всем вместе, то спекулировать умом над этим вопросом я позвал двух замечательных ребят: Сашу Лиса и Стаса Фискова, которые шарят в финансах и инвестировании куда больше меня. Результатам пары вечеров в google docs стала эта модель.
Что посмотреть в Милане за один день
У меня получилось найти один день, чтобы смотаться в Милан. При чём, как всегда, не обошлось без необходимости использовать коммуникационные навыки, чтобы объяснить кондуктору, что я не знал, что билеты нужно компостировать. Особо делать в Милане, если честно, нечего. Бары в понедельник, например, закрываются около 10 вечера. Потрясающе, правда? …
7 самых важных принципов по которым работает твой мозг
О, сколько нам открытий чудных
Готовят просвещенья дух
И опыт, сын ошибок трудных,
И гений, парадоксов друг,
И случай, бог изобретатель.
У меня есть плохая новость — мышление каждого человека на низком уровне абстракции абсолютно одинаково. Все люди имеют одинаковый потенциал. Деление на математиков и гуманитариев очень абстрактно и потенциально любой художник, которого воротило в детстве от математики может брать интегралы не хуже олимпиадника по математике.
Основы биоинформатики. Шпаргалка по биоинформатике
По окончании двух курсов у меня оказались конспекты 3х курсов: «Elements of Biophysics», «Laboratory of bioinformatics», «Molecular Antropology and Human Biodiersity».
Они покрывают те физические явления и законы, которые необходимо знать, чтобы понимать как и что происходит внутри клетки, а также почему так сложно с этим разобраться: свободная энергия Гиббса, энтропия, уравнение Харди-Вейнберга, структура протеина, базовые вещи о ковалентных и не только связях.