Ang Nangungunang 20 Website para Mag-access ng Libreng Data para sa Pagsasanay

Ang Nangungunang 20 Website para Mag-access ng Libreng Data para sa Pagsasanay
Ang mga mambabasang tulad mo ay tumutulong sa pagsuporta sa MUO. Kapag bumili ka gamit ang mga link sa aming site, maaari kaming makakuha ng isang affiliate na komisyon. Magbasa pa.

Nagsasagawa ka man ng pananaliksik sa merkado, pagbuo ng iyong portfolio bilang isang analyst, o naghahanap ng mga insight para palawakin ang iyong abot sa merkado, mahalaga at maaasahang data ang mahalaga para sa matalinong paggawa ng desisyon.





MUO Video ng araw MAG-SCROLL PARA MAGPATULOY SA NILALAMAN

Gayunpaman, ang paghahanap sa internet ng libre, maaasahan, at naa-access na data ay may ilang hamon. Gagawin ng artikulong ito ang iyong paghahanap ng data-hunting na hindi gaanong mahirap sa pamamagitan ng pagpapakilala sa iyo sa ilan sa mga nangungunang website upang ma-access ang libreng data.





  Ang unang pahina ng Google Trends

Ang Google Trends ay isang libreng serbisyo na binuo ng Google na nagbibigay sa mga user ng hindi na-filter na mga sample ng data ng mga kahilingan sa paghahanap na ginawa sa Google. Bagama't ang serbisyong ito ay nagpapakita ng data ng time series mula 2004 hanggang sa kasalukuyan sa parehong pandaigdigang antas at antas ng lungsod, hindi nito ipinapakita ang mga personal na detalye ng mga user ng search engine.





Maaari mo ring paghigpitan ang data upang tumuon sa mga kategorya, wika, entity, o trending na paghahanap sa Google gamit ang Google Trends . Kasama sa mga halimbawa ng magagamit na data araw-araw na mga uso sa paghahanap at real-time na mga trend sa paghahanap , na nagpapakita ng data sa nakalipas na pitong araw.

kung paano kumita ng pera sa paglalaro ng mga laro

2. FiveThirtyEight

  Ang landing page ng FiveThirtyEight

Ang FiveThirtyEight ay isang website ng data journalism na mayroong data tungkol sa pagsusuri ng poll, sports, pop culture, pulitika, agham, at mga pangyayari sa ekonomiya.



Ang magandang bagay tungkol sa website ay maaari mong i-download ang data mula sa kanilang website o sa kanila opisyal na imbakan ng GitHub at gamitin ang iyong mga tool sa visualization ng data upang lumikha ng mga mapang-akit na data journalism visual para sa iyong madla. Ang ilang mga halimbawa ng kawili-wiling data na magagamit ay kinabibilangan ng mga hula sa world cup at 2022-23 data ng mga hula sa NHL .

3. BuzzFeed News

  Ang landing page ng BuzzFeed News

Ang BuzzFeed News ay isang American breaking news at orihinal na platform ng pag-uulat na nag-uulat ng lahat mula sa journalism, tech, entertainment, celebrity news, kultura, at DIY hacks hanggang sa kalusugan at pulitika.





Sa GitHub nito, ginagawa ng BuzzFeed News ang dataset, mga tool, at pagsusuri nito mula sa newsroom ng BuzzFeed na open-source, naa-access, at available. Kasama sa isang halimbawa ang Data ng pagsusuri sa background ng armas ng FBI NICS .

4. data.gov

  Ang landing page ng Data.gov

Ang Data.gov ay ang open data website ng gobyerno ng United States na nagho-host ng higit sa 250,000 publicly available, well-documented datasets mula sa international at maramihang federal government agencies. Ang ideya sa likod ng inisyatiba na ito ay upang magbigay ng isang bukas at transparent na pamahalaan.





Maaari mong i-access ang data mula sa website batay sa paksa at ahensya o organisasyon. Ang ilang halimbawa ng data na makikita mo sa Data.gov ay ang national student loan data system at data ng populasyon ng electric vehicle .

5. Kaggle

  Ang landing page ng Kaggle

Ang Kaggle ay isang pampublikong palaruan ng data na nakuha ng Google na nag-aalok ng malawak na hanay ng mga dataset sa iba't ibang paksa. Binibigyang-daan ka ng platform ng komunidad na ito na ibahagi ang iyong mga code, matuto, makipag-collaborate sa mga kapwa propesyonal sa data, at maghusay ng kakayahan. Nagho-host din ang Kaggle ng mga kumpetisyon sa data science kung saan maaari kang manalo ng iba't ibang mga premyo.

Ang gabay na ito ay nagbibigay ng a gabay ng baguhan kung paano magsimula sa Kaggle para sa agham ng data . Ang isang halimbawa ay ang Pandaigdigang Istatistika ng YouTube 2023 .

6. Data ng Earth Mula sa NASA

  Ang landing page ng Earth Data mula sa NASA

Ang EarthData ay isang data initiative ng NASA na nagsisilbing repository ng earth data mula 1994 hanggang ngayon. Maaari kang makakuha ng data na nauugnay mula sa malayong impormasyon ng satellite hanggang sa data tungkol sa kapaligiran ng Earth, karagatan, at Terrestrial Hydrosphere.

Maaari kang mag-browse ng iba't ibang mga paksa at ma-access ang data tulad ng data ng matinding init . Gayunpaman, kakailanganin mong galugarin Ang planetary data system ng NASA para sa non-earth data.

7. IMDb Dataset

  Ang landing page ng IMDb Dataset

Nagbibigay ang IMDb ng data tungkol sa mga pelikula, serye sa TV, home video, podcast, video game, streaming na impormasyon, at celebrity content. Ang isang halimbawa ay Mga hindi pangkomersyal na dataset ng IMDb .

8. Mga Publikong Dataset ng AWS

  Ang landing page ng AWS Public Datasets

Ang AWS Public Dataset ay isang website na nagho-host ng mahigit 3000 set ng data ng mga dataset na ginawang available sa publiko sa pamamagitan ng mga serbisyo ng AWS. Karamihan sa mga dataset dito ay batay sa proyekto. Ang ilan ay kinabibilangan ng atlas ng cancer genome at Foldingathome COVID-19 Datasets .

9. Sa loob ng Airbnb

  Ang landing page ng Inside Airbnb

Ang Inside Airbnb ay isang watchdog website na inilunsad ni Murray Cox. Pinagmumulan ng website na ito ang data na available sa publiko mula sa Airbnb , isang platform na nag-aalok sa mga user ng budget-friendly na kwarto sa buong mundo. Maaari mong gamitin ang impormasyon mula sa site na ito upang magsagawa ng analytics tulad ng rental analytics ng Montreal .

  Ang landing page ng Google Dataset Search

Ang Google Dataset Search ay isang dataset search engine na ginawa ng Google na nagho-host ng mahigit 20 milyong dataset. Tulad ng kanilang search engine, maaari kang makakuha ng data mula sa halos anumang bagay. Ang isang magandang halimbawa ay ang Data ng pagmamanman sa kalidad ng tubig ng pambansang Canada .

labing-isa. UCI Machine Learning Repository

  Ang landing page ng UCI Machine Learning Repository

Ang UC Irvine Machine Learning Repository ay tahanan ng 624 na dataset para sa komunidad ng machine learning sa mundo. Ang website na ito ay may malakas na reputasyon sa komunidad dahil ang mga dataset ay nakategorya batay sa mga gawain sa machine learning na angkop sa kanila. Ang isang halimbawa ay ang Iris dataset , isang sikat na klasipikasyon at clustering model dataset.

12. datahub.io

  Ang landing page ng Datahub.io

Ang Datahub bilang isang platform ay may maraming mga dataset na sumasaklaw sa malawak na hanay ng mga paksa tulad ng 10-taong US Government Bond Yields (pangmatagalang rate ng interes) . Bukod sa data, nagpapakita rin sila ng mga tool at toolkit ng data na maaaring pumasok para sa mga propesyonal sa data.

maaari mo bang ilagay ang isang tagapagtanggol ng screen sa isang basag na screen

13. Imbakan ng Data ng Global Health Observatory

  Ang landing page ng Global Health Observatory Data Repository

Ito ang unang website sa aming listahan para sa eksklusibong data ng kalusugan. Ang Global Health Observatory ay nagsisilbing isang imbakan ng data na nagpapakita ng mga istatistikang nauugnay sa kalusugan para sa higit sa 1000 mga tagapagpahiwatig para sa 194 na estadong miyembro ng WHO. Ang data ay naitala upang subaybayan ang pagsulong ng mga estadong miyembro na ito patungo sa mga layunin ng SDG. Maaari kang makakuha ng data sa pamamagitan ng pag-filter sa tema, kategorya, metadata, at indicator ng data.

14. British Film Institute

  Ang landing page ng British Film Institute

Ang platform na ito ay talagang batay sa niche. Ipinapakita nito ang data ng pananaliksik at impormasyon sa market intelligence tulad ng weekend box office figures at kaugnay na data sa industriya ng pelikula sa UK.

labinlima. GitHub

  Ang landing page ng Awesome Public Datasets repository

Ang GitHub ay higit pa sa tahanan ng milyun-milyong collaborative at open-source na proyekto. Nagho-host din ang platform ng maraming repositoryo na naglalayong magkaroon ng libre, pampubliko, at open-source na mga dataset. Kahit na Ang BuzzFeedNews ay may open-source na GitHub repository .

Ang iba pang mga halimbawa ay ang Kahanga-hangang Public Datasets repository at inaangat mo pa ba ang dataset . Kaya mo rin mag-ambag sa mga open-source na proyektong ito sa GitHub .

16. data.mundo

  Ang welcome page ng Data.world

Ang Data.world ay isang komunidad ng data at collaborative na platform na nagho-host ng mga proyekto ng data at mga dataset. Bagama't binabayaran ang ilang dataset, karamihan sa data sa platform, tulad ng Makeover Lunes 2021/W16: buwanang mga pasahero sa himpapawid sa America , ay libre at madaling ma-download nang lokal o ma-access sa pamamagitan ng kanilang API.

17. Open Data ng World Bank

  Ang pahina ng data ng World Bank Open Data

Ang World Bank Open Data ay isang catalog ng global economic at development data. Maaari mong i-browse at i-filter ang data, tulad ng pandaigdigang istatistika sa gastos at abot-kaya ng mga malusog na diyeta sa pamamagitan ng tagapagpahiwatig at bansa.

18. Data ng NASDAQ

Ang Nasdaq Data Link ay para sa lahat ng pinansyal, pang-ekonomiya, at alternatibong data. Maaari mong ma-access ang data tulad ng Mga release ng data ng federal reserve ng US sa pamamagitan ng isang spreadsheet tulad ng Excel o isang API.

  Ang pahina ng data ng Nasdaq Data

19. NYC TLC

  Ang landing page ng NYC TLC

Ang NYC Taxi at Limousine Commission ay nagtatala ng data platform at nagho-host ng impormasyon tulad ng dilaw at berdeng mga rekord ng biyahe ng taxi sa buong New York City . Ang magandang bagay tungkol sa website na ito ay nagpapakita ito ng impormasyon tungkol sa lahat, mula sa pick-up/drop-off hanggang sa taxicab zone at mga pamasahe sa biyahe.

pinakamahusay na lugar upang bumili ng refurbished macbook

dalawampu. Akademikong Torrents

  Ang landing page ng Academic Torrents

Ang Academic Torrents ay isang data catalog ng higit sa 127.15 TB ng data ng pananaliksik. Ito ay itinayo, gaya ng sinasabi nila, para sa mga mananaliksik at ng mga mananaliksik.

Mag-explore at Matuto

Sana, sa listahang ito, makakakuha ka ng data na maaaring humubog sa landscape ng iyong negosyo, humimok ng iyong pananaliksik sa merkado, magkaroon ng competitive edge, at tulungan kang buuin ang natatanging data portfolio na iyon nang walang bayad. Kaya tanggapin ang mga pagkakataon, galugarin, at magkaroon ng hindi gaanong mapaghamong paghahanap ng data-hunting.