З бази стартапів http://www.crunchbase.com/ за допомогою скриптів, які доступні тут можна отримати дані для подальшого аналізу. Сьогодні аналізуватимемо проекти залежно від країни.
Передмова та аналіз засобами SQL від Андрія Корнілова тут.
Маємо інформацію про трохи більше як 60 000 проектів. Якщо вибрати серед них ті, які отримали кошти- цифра стає значно скромнішою - біля 10 тис.
Розглянемо розподіл коштів, для кращого сприйняття результатів будемо представляти результати в тисячах $.
summary(companydatapos$raised_amount)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1 1320 5650 17410 16350 5620000 sd(companydatapos$raised_amount)
[1] 73466.3
Отже, мінімальна сума коштів, які отримав проект - 1000 $, максимальна - 5620000000 $. Медіана (тобто типова сума, яку отримала більшість компаній) - 5,6 млн, а середнє значення 17 млн, яке до того ж більше 3 квартилі, яка відмежовує 25% найбільших значень. Іншими словами, на середнє мають сильний вплив суми, отримані компаніями, які залучили найбільші інвестиції. Дуже велике значення стандартного відхилення - 73 млн.
Шукаємо інформацію, про проект, який отримав найбільшу суму:
name founded_year country_code state_code zip_code cityClearwire 2003 USA WA 98033 Kirkland
А ось і сайт цього проекту: http://www.clearwire.com/
Більше 1 млрд отримало 7 проектів:
row.names name country_code raised_amount 1 1926 AOL USA 1003000 2 6922 Clearwire USA 5620000 3 12133 USA 2335700 4 12708 Fisker Automotive USA 1033000 5 14989 Groupon USA 1137000 6 24776 O3b Networks GBR 1275000 7 34587 Terra-Gen Power USA 1200000
Яка ж ситуація в Україні?
row.names name country_code raised_amount 1 3445 Bartermill.com UKR 40 2 14024 Gera-IT UKR 50 3 28487 Railsware UKR 500
Відкинемо дані, які більше 1 млрд
summary(companydatapos$raised_amount)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1 1320 5641 16180 16300 813000
sd(companydatapos$raised_amount) [1] 38225.12
Відхилення зменшилось вдвічі, але далі досить великий розкид даних. Крім того, 6 із 7 знаходяться в США, тобто на інші країни впливу не здійснюють. Тому в подальшому - розлядаємо всі дані.
Для кожної країни рахуємо мінімальне, медіану, середнє та максимальне значення, суму коштів отриманих країною, а також кількість проектів, які отримали фінансування.
summary(sumcountry$countst) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.0 2.0 5.0 134.8 33.0 7930.0
Медіана кількості проектів, які отримали фінансування - 5.
Переглянемо, в яких країнах є хоча б 50 проектів, які отримали гроші:
row.names minst medianst meanst maxst sumst countst 1 USA 1.0 6972.5 19046.985 5620000 151156875.4 7936 2 GBR 10.0 3035.0 14108.524 1275000 7421083.4 526 3 CAN 1.2 5000.0 11472.462 350000 3957999.4 345 4 FRA 50.0 2935.0 6446.467 149000 1972619.0 306 5 ISR 20.0 4300.0 9630.223 115000 2715722.9 282 6 CHN 7.0 12000.0 29960.042 478000 4853526.8 162 7 IND 6.0 6555.0 15369.173 300000 2489806.0 162 8 DEU 15.0 3185.0 9063.494 158700 1395778.0 154 9 SWE 35.0 2595.0 5629.930 79960 585512.7 104 10 ESP 15.0 1930.0 7566.904 218400 628053.0 83 11 CHE 10.0 5600.0 27193.805 515000 2093923.0 77 12 AUS 7.0 1800.0 6539.231 90000 438128.5 67 13 IRL 70.0 3900.0 6832.031 50250 437250.0 64 14 DNK 10.0 3865.0 10191.793 160400 591124.0 58
Побудуємо коробчасту діаграму отриманих коштів для кожної з цих країн:
Присутність даних про проекти з мільярдними інвестиціями, а також велика, порівняно з іншими країнами, кількість успішних проектів у США не дозволяє побачити картинку для інших країн. Усунемо з діаграми США та Великобританію:
Для всіх країн (зараз розглядаємо ті, у яких більше 50 проектів, які отримали фінансування) характерні значні відхилення від середнього значення.
Розглянемо ще відсоток проектів з фінансуванням до всіх, які зареєстровані в цій країні. Країни, де зареєстрований 1 проект, який і спрацював, тому спрацювало 100 % - відкидаємо.
summary(merged$percent) Min. 1st Qu. Median Mean 3rd Qu. Max. 3.85 11.18 16.67 19.52 23.75 51.18 sd(merged$percent) [1] 12.11956
Найбільш успішні в цьому плані Ізраїль - 51% з 551 проекту та Китай 41% з 388. Найбільша кількість спрацювавших проектів в США, але відсоткове співвідношення тут 31 %. В середньому ж отримує фінансування 1 з 6 проектів.
Найближчими днями будемо досліджувати розподіл залежно від галузі. Переглянути в які стартапи як інвестують можна тут
http://energyfirefox.blogspot.com/2011/07/cruncbase.html
треба розширити базу датою отримання першого фінансування того чи іншого типу (посів, ангельське тощо) і проаналізувати залежності фінансування від часу життя, галузі тощо. відкинути фірми, які створені більше ніж н років від отримання коштів - це, швидше за все, не стартапи. н напевно буде різне для різних галузей
ВідповістиВидалити