Почему стоит принять участие в Startup Access. Стоит ли ехать в Бостон.

Это будет отзыв о программе StartupAccess. Это будет рассказ о Америке, которую вы не привыкли себе представлять, постоянно читая про встречи крутых предпринимателей в долине. Это будет попытка передать то, что можно только прочувствовать на себе, оказавщись здесь для того, чтобы поменять что-то в своём бизнесе.

И раз уж вы начали читать этот отчёт о поездке и он захватил ваше внимание, я хочу выразить огромную признательность технопарку Академгородка, который спонсировал нашу с Ильёй поездку и позволил принять участие в таком полезном деле. А также, хочу сказать огромное спасибо Лене и Сергею, которые организовали этот супер-полезный бизнес-инкубатор и которые дают возможность командам из России приобщиться к американской предпринимательской культуре. Насколько важную работу они проделали будет очень трудно передать словами, это надо испытать на себе, ну или хотя бы прочитать этот отзыв о Startup Access, чтобы понять, стоит ли ехать.

… 

 

Мадрид за один день. Что можно посмотреть в Мадриде за время пересадки.

Итак, перелёт до Нью-Йорка у меня был с 8мичасовой пересадкой в Мадриде.

 

Barajas, Madrid

Barajas, Madrid

Метро за 7 евро довезло меня прямо до центральной станции Sol, которая была брендирована Vodafone’ом (это значит, что на всех картах станция метро называется Vodafone Sol). Там же я купил себе местную симку, чтобы нормально передвигаться по городу, и пошёл гулять.

… 

 

Что посмотреть в Нью-Йорке за один день, или как обойти NY за 8 часов

Собственно, на Нью-Йорк у меня был 1 день. Я доехал до южной части Манхэттана, зафотал издалека статую, ехать до которой было слишком влом и отправился гулять по NY.

Естественно, потом я отправился пройтись по Wall Street и сфотался на фоне Нью-Йоркской фондовой биржи. У знаменитого быка, погладив гениталии которого вроде как становишься богаче (мне кажется, нью-йоркцы должны искренне смеяться над этой традицией), была очередь, которую я проигнорировал.

… 

 

Экскурсия в Broad Institute

Сегодня у нас была экскурсия в Броад институт. Фактически, экскурсия идет сейчас и этот пост я пишу прямо из конференц-зала.

Это место – передовая современной биофинорматики, тут находится 52 машины для секенирования генома (как раз расшифровки и определения того, где какое основание в ДНК находится), которые работают 24 часа в сутки, 7 дней в неделю, для того чтобы проводить расшифровку генома для различных исследований и медицинских в том числе

Когда открывали этот институт, в основу легла идея того, что все данные, которые будут проходить через этот институт, будут становиться общественным достоянием и будут публиковаться в открытом доступе. Сейчас, кстати, они секвенируют порядка тера базовых пар, что очень и очень много.

Например, тут исследуют, какие гены могут активировать раковую мутацию, или отвечать за генетическу болезнь. Причем, они зачастую не интерпретируют результаты, а просто высылают результаты дальше по цепочке. Для этого у них есть Illumina HiSeq 2500 (требуется порядка 16-24 часов для секвенирования), HiSeq 2000 (2-2.5) дня или MiSeq. Стоимость этих игрушек порядка 700 тысяч долларво каждой. На секвенирование генома от поступления генетического матрериала для отправки готового генома уходит примерно 2-2.5 недели.

В принципе благодаря таким лабораториям и институтам можно будет в будущем получать достоверную картину вероятности проявления генетической болезни. Потому что даже сегодня, выделив участки ДНК, отвечающие за появление чего-то плохого, можно не бояться даже при вероятности заболеть в 80%, потому что выборка могла быть построена только на больных людях и на самом деле вероятность заболеть у пациента куда меньше.

В общем, благодаря таким местам мы все более приближаемся к персонализированной медицине, что не может не радовать. Для того, чтобы понять, насколько большая работа предстоит человечеству для того, чтобы полностью победить рак, представьте себе снайпера, который должен попасть в копеечную монету с расстояния порядка 100км. Представили? Так вот, суть в том, что все имеет еще более маленький масштаб, потому что за проявление каких-то последствий может отвечать участок в 100-200 оснований из 1 миллиарда, и это необходимо находить и каким-то образом интерпретировать и думать о том, как с этим бороться.

И это в принципе относится ко всему в биоинформатике, потому что 99.9% генома у всех людей совпадают и очень сложно искать участки и выявлять то, за что они отвечают.

 

Gag Driven Education

Собственно, больше всего полезного опыта и знаний я получил, желая сделать что-то совсем бесполезное и тупое. Например — писал бота, который смотрит кто когда и во сколько заходит вконтакт (так я и выучил Python), или вот например сейчас, пока битый час искал нужный параметр, чтобы построить нужный график в R.

А виной всему послужила мысль о том, что «Сетевой маркетинг — это бесконечная история о том, как люди пытаются бороться с первым началом термодинамики». Чтобы проиллюстрировать эту мысль, я задался целью сделать вот этот график:

physistsИтак, нужно было сделать простейший stacked barplot, что весьма просто делается командой barplot(). В итоге я вспомнил, как правильно инициализировать объекты в R и докопался до дао параметра xlim:

#Инициализируем данные
mydata<- data.frame(x=1,y=rep(0,100))
mydata[100,]<-1

#Тут ключевое — это as.matrix() и table(), потому что без них выйдет полная фигня, а также xlim — который позволяет сделать график не таким широким
barplot(as.matrix(table(mydata$y)), width=0.5,xlim=c(0,5),beside = FALSE,main=”Количество физиков в сетевом маркетинге”,
, col=c(“darkblue”,”red”),
legend = c(‘Все остальные’,’Физики’))

Теперь собственно, способы инициализации пустого фрейма:

1) Использование rbind

До цикла:

d = NULL

Внутри loop:

d = rbind(d, data.frame(x, y, z))

2) Способ быстрее, но требует знать конечный размер объекта

d = data.frame( x=rep(0, 10), y=rep(0,10), z=rep(0,10))

В цикле:

d[i, ] = c(x, y, z)

3) Сначала инициализируем нужные векторы, а затем:

x = NULL
y = NULL
z = NULL

Затем:

d = data.frame(x, y, z)

 

 

 

Data Mining Cheatsheet Mind Map

Пока что эта шпаргалка содержит информацию только по курсам Data Analysis и Statistics One, без дополнений из того, что я почерпнул в университете. Но чтобы в дальнейшем не забывать, я составил Mind Map с полезными функциями, командами, и узкими моментами, с которыми можно столкнуться при анализе данных.

Data Mining Mind Map

Data Mining Mind Map

 

 

 

Получение визы в США, находясь в Италии

Итак, следуя ретроспективе, поскольку мне надо было получить американскую визу, я начал этот квест. В свою очередь, информации об увлекательнейшем процессе получения визы в США для гражданина РФ в интернете не то, чтобы было много, поэтому весь процесс я опишу в этом посте.

Для начала мы заходим на сайт посольства США в Италии.

Оказывается, с получением визы у американцев всё просто, что не может не радовать и для этого есть специальный сайт.

Окей. Регистрация на нём требует получения номера DS-160, это электронная форма заявления на неимиграционную визу в США. Чтобы заполнить это заявление, мы переходим на https://ceac.state.gov/CEAC/, где, кстати, для заполнения заявления можно выбрать русский язык (!) и указать даже консульство, в котором вы хотите подавать документы на визу.

У меня есть выбор из: Милана, Флоренции, Рима и Неаполя. Поскольку гугл не подсказывает ничего путного, где оформление пройдёт быстрее, я выбираю Милан.

Собственно потом, после стандартного заполнения формы DS-160, которое тысячу раз было разжёвано на разных форумах, всё что остаётся сделать — это оплатить консульский сбор на специальном сайте. И назначить дату интервью. С оплатой с карточки почему-то возникла проблема (не приняли ни одну из моих карт (sic!), поэтому оплатить пришлось при помощи личного визита в банк.

Я проходил интервью всё-таки Риме, консульство вынес на фотку поста. Очередь, интервью, скан отпечатков, и необходимость очень далеко ехать за полученной визой описаны двумя постами ниже.

Получение самой визы

Рим за один день и интервью у консула

 

Что посмотреть в Риме за один день — утро в Вечном городе — собеседование у консула

Ночь четверга была прекрасной. Прекрасным и был мой сон, не пробуждение в 1:52, когда единственный нужный поезд отправляется до Рима в 2:15. У меня был прекрасный план встать по будильнику, побриться, собраться и прогуляться до вокзала пешком по ночной Болонье, свободной от бродяг и вечно спешащих для того, чтобы пообщаться с друзьями итальянцев.

Щас. Мне кажется, я побил все мыслимые и не мыслимые рекорды скоростных сборов и ночного бритья, пока моё сознание ещё догоняло тело, которое выходило из квартиры и вызывало лифт. Следующий раз мозг попытался взять всё под свой контроль в тот момент, когда я смотрел на часы, показывающие 2:07  и я уже находился на вокзале. Видимо после этого та моя часть, которая привыкла никогда не сдаваться даже если всё идёт совсем не по плану, решила, что оставит моему сознанию только боль в мышцах ног, которые уже и не надеялись на занятия спортом, жжение в лёгких и мысли о парочке наверняка побитых мировых рекордов. Только к тому моменту до меня дойдёт мысль, что, возможно, собеседование в Риме в 9:30 было не самой лучшей идей, а потом, в свою очередь дойдёт мысль, что на этот поезд точно не стоило опаздывать.

… 

 

Получение американской визы находясь в Италии

Итак, эту мини-эпопею с получением американской визы, находясь в Италии я начну рассказывать с конца. Забирать визу, в случае её одобрения предлагается в ближайшем центре DHL, или доплатить 39 баксов за то, чтобы её доставили к тебе на дом. «Ого, прогуляюсь немного» — решил я, и выбрал получение в Interporto Bologna 9.4. Судя по карте, это было в 30 минутах езды на автобусе от того места, где я живу. Отлично.

Итак настал день поездки до DHL. Предварительно я позвонил, убедился что паспорт находится у них (чтобы не ездить понапрасну).

Окей, на ресепшне я узнал, что это на самом деле очень далеко и туда идёт 97 автобус, который отправляется с автовокзала. Окей, подумал я. Отлично. Хотя бы понятно как ехать. На автовокзале оказалось, что единственный автобус отправляется в 7:30. На часах 9:22. Но я понимаю, что паспорт я в любом случае заберу сегодня, не смотря ни на что и отправляюсь на вокзал.

На вокзал я пришёл в 9:31. Иду покупать билет. Нужный поезд отправляется в 9:35, следующий через час, ждать его совсем не хочется, а ведь нужно ещё купить билет, узнать какая платформа и дойти до неё. «Окей», — я уже даже не переживаю когда такое происходит. 2 раза автомат по продаже билетов не принимает карту. Плачу мелочью 2.1 евро. Ищу на табло номер своего поезда, не нахожу. «Окей», — я всё равно доеду до этой станции. Иду до женщины, под вывеской “Information”. Узнаю платформу, на часах 9:35. Бегу до платформы, оказалось что поезд задержали. В принципе, я так и думал.

Середина ничего

Середина ничего

За 15 минут я доехал до этой станции, которая считается пригородом Болоньи или что-то вроде того, вышел и офигел. Такое ощущение, что настал зомби-апокалипсис и все умерли. Сверился с картой, отправился прямо по дороге, думая, что если что перейду Ж/Д пути подальше. Ага. Это же Европа. Пути огорожены, перелезть нельзя. Какой-то итальянец объясняет мне, что я зря топал 30 минут пешком. Спасибо, цивильная Европа, всегда мечтал утром понедельника пройти туда-обратно по узкой обочине. О том, в насколько глухую сторону меня занесло красноречиво вопит тот факт, что на улице в кустах бегают зайцы. Просто дикие зайцы на обочине.

Провинциальные виноградники

Провинциальные виноградники

Иду обратно, пытаюсь поймать машину. Как мне позже расскажут одногрупник, голосующих на дороге тут никто не подбирает. Как чуть ниже докажу я, это правило не действует на русских. Дохожу до станции, перехожу ж/д пути, начинаю топать. Идти километров 8, до этого DHL. Поднимаю руку с оттопыренным большим пальце и не отходя 200 метров от станции, останавливаю мужичка Петро. Он не говорит по-английски, но моего итальянского хватило на то, чтобы рассказать, как у них всё грустно с переходами путей, куда мне надо. Он без проблем подвёз меня, хотя ехать ему было я так понял, не сильно по пути, ещё и предложил потом до станции добросить, но я его поблагодарил и сказал, что уже разберусь сам, тем более я не знал, сколько мне будут отдавать пакет.

Здоровенный терминал DHL

Здоровенный терминал DHL

Паспорт мне отдали за рекордные 5 минут, а потом девушка искренне удивилась, что я приехал получать посылку не на машине, а пришёл пешком. Она даже спросила меня, как я добрался, уж не пешком ли. В общем, дорогу у неё спрашивать было также бесмысленно, как и искать честного чиновника в любом департаменте, отвечающем за строительство дорого в России, поэтому я вышел и спросил у ребят на улице, как быстрее добраться до станции. Они сказали, что на машине и только улыбнулись, узнав, что я дошёл пешком.

Посмотрите, сколько народу ходит вокруг!

Посмотрите, сколько народу ходит вокруг!

Ну что же, снова обочина, утыкаюсь в WhatsApp, поднимаю руку, когда мимо меня кто-нибудь едет. В этом огромном, бля, логистическом комплексе, так и никто не останавливается. Уже пройдя КПП, мимо меня проезжает паренёк, у которого я спрашивал дорогу и говорит что добросит. Ура, я так и знал, что рано или поздно кто-нибудь остановится.

На станцию я доехал в 11:42, а поезд до Болоньи отправлялся в 11:45. Мне не привыкать, и уж тем более я не хотел тратить время, узнавая где покупать билет.

Вот так вот я побывал в середине итальянского нигде и вернулся обратно. В следующем посте вас ждёт история о том, как я ездил в Рим на интервью.

Начало истории о том, как получить американскую визу, находясь в Италии.

 

Самые интересные, на мой взгляд лекции с ШАД Яндекса

Combinatorial Theory of OverfittingKonstantin Vorontsov (Russia)
Active learning to rankVladimir Gulin (20 min).
это очень крутая лекция от автора исходного алгоритма, факт его доклада показывает на каком уровне проходит конференция в Яндексе:
Explaining AdaBoostRobert Schapire (USA)
MatrixNet is Yandex’s implementation of Gradient Boosted Decision Tree algorithm (GBRT)Andrey Gulin (Russia)