Det er den tid på året igen, når GitHub frigiver sin årlige Octoverse-rapport og giver os et glimt af den aktuelle tilstand i udviklerfællesskabet og deres præferencer på den største arkivplatform.
Ifølge rapporten har Python for første gang overgået Java som det næstmest populære sprog på GitHub af arkivbidragere.
Mellem oktober 2018 og 2019 samarbejdede udviklere på mere end 370 primære sprog på GitHub. Heraf fortsætter JavaScript med at dominere platformen med den første position, mens Python erhvervede den anden position ved at skubbe Java til tredjepladsen.
Datavidenskab fremmer væksten i Python-programmeringssprog
Indtil for nylig var GitHub traditionelt basen for softwareudviklere, men kodningssamfundet udvikler sig. En af de største faktorer bag Pythons vækst er en ”hurtigt voksende samfund af datavidenskabelige fagfolk og hobbyister - og de værktøjer og rammer, de bruger hver dag.”
Lige nu er der flere centrale datavidenskabelige pakker drevet af Python på GitHub, der ikke kun hjælper flere brugere med at deltage i datavidenskabsfeltet, men som også viser sig at være grundlæggende for projekter i både den akademiske verden og virksomheder.
Bortset fra Python har arkiver med emner som "dyb læring", "naturlig sprogbehandling" og "maskinindlæring" vundet popularitet gennem årene i datavidenskabssamfundet..
Ifølge GitHub er mere end 50% af de mest populære (baseret på antallet af stjerner) offentlige lagre, der er mærket med disse emner, bygget på følelsesløs. Mens mange af dem bruger scipy, scikit-learning og TensorFlow.
Der er også en stigning i ikke-kodebidrag fra datavidenskabsfeltet, inklusive akademiske papirer siden sidste år.
Andre bemærkelsesværdige konklusioner fra GitHubs Octoverse-rapporter om datavidenskab og Python-relaterede opbevaringssteder er:
- Vækst af Jupyter-notesbøger, 2016-2019: I de sidste tre år har brugen af Jupyter Notebooks (ved antallet af arkiver med Jupyter som deres primære sprog) set mere end 100% vækst år-over-år i de sidste tre år
- Vækst i lagre til behandling af naturlige sprog, 2016-2019: Naturlig sprogbehandling (NLP) er et andet vigtigt område inden for datavidenskab, der samler damp på GitHub, da pakker som NTLK sænker barrieren for adgang til NLP-arbejde.
Læs også: Linus Torvalds: ”Jeg kender slet ikke kodning”