Ako vypočítať priemer zo zoznamu - podrobne vysvetlená štatistika a stredná Pythonova funkcia

Matematika a programovanie idú ruka v ruke. Ak ste programátor, v určitom okamihu budete musieť používať matematiku.

Dátová veda, strojové učenie, umelá inteligencia a kryptomeny sú založené na zložitých základných matematických princípoch.

Používanie matematických funkcií však nemusí byť zložité! Python všetko abstrahuje, takže akonáhle pochopíte pojmy, nebudete musieť porozumieť všetkým podrobnostiam implementácie.

Matematika nemusí byť strašidelná

Existuje veľa matematických funkcií, na ktoré narazíte. Ak pracujete s údajmi alebo s analytikou, je dôležité, aby ste pochopili niektoré matematické princípy a funkcie.

Jednou z takýchto funkcií, ktorú musíte pochopiť, je meanfunkcia.

Nenechajte sa odradiť menom - o meanfunkcii v Pythone nie je nič zlé (zamýšľané ako slovná hračka) .

Tento príspevok je samostatný, ale predpokladám, že máte nejaké skúsenosti s prácou s Pythonom a viete, čo je to zoznam Pythonu. Ak nie, pred pokračovaním si prečítajte tento článok.

Keď skončíte, vráťte sa a pripojte sa ku mne, aby som sa podrobne ponoril do tejto meanfunkcie.

Štatistika

Takže sa chcete dozvedieť viac o meanfunkcii. To je skvelé! Ale predtým, ako sa pozrieme na túto funkciu, je dôležité pozrieť sa na disciplínu, z ktorej pochádza: štatistiku.

Na obrázku vyššie vidíme graf. Graf je obrazové znázornenie, ktoré zobrazuje vzťah jednej premennej k inej.

Grafy sú užitočné, pretože nám umožňujú usporiadať údaje tak, aby sme rýchlo videli trendy a vzťahy medzi údajmi. Graf je len jeden nástroj, ktorý môžeme použiť na vizualizáciu a analýzu údajov.

Štatistika je odvetvie matematiky, ktoré nám umožňuje systematicky triediť, analyzovať a interpretovať údaje. To je dôležité, pretože so štatistikami máme zbierku hotových nástrojov na vykonávanie každej z týchto vecí.

Predstavte si, že by ste potrebovali pílku vymyslieť zakaždým, keď potrebujete vyrezať kus dreva. Veľa ľudí by volalo píly rôznymi menami, aj keď by robili to isté. Aby sme sa vyhli tomuto problému, dali sme píle názov, na ktorý ju môže každý označiť.

To isté sa deje v štatistikách - máme známe nástroje, ktoré každý pozná. Jedným z takýchto nástrojov je priemer.

Režim, stredná hodnota a stredná hodnota

Aj keď je priemer úplne schopný samostatne stáť, zvyčajne sa vyučuje ako súčasť tria, ktoré obsahuje mód, medián a priemer.

Pozrime sa na skupinu čísel, aby ste pochopili, čo sa tu deje. Predstavte si, že máte nižšie uvedené čísla:

1, 2, 3, 3, 4, 6, 9

Povedzme, že sme chceli povedať, ktoré číslo sa vyskytuje najčastejšie. Boli by to 3 a názov, ktorý tejto vlastnosti dáme, je režim. Režim je číslo, ktoré je najbežnejším súborom, ktorý skúmame.

Číslo uprostred usporiadanej množiny sa nazýva medián. Ak chcete vyhľadať medián numerickej množiny, usporiadajte čísla od najmenších po najväčšie a potom sa pozrite na číslo v strede. Množina čísel vyššie je už usporiadaná od najmenšieho po najväčší, takže stredné číslo je tiež 3.

Priemer je nakoniec ďalším spôsobom, ako odkazovať na priemer súboru. Ak chcete zistiť strednú hodnotu, stačí spočítať všetky čísla a vydeliť ich celkovým počtom prvkov v množine. V prípade vyššie uvedených čísel, ak ich spočítame všetky, získame 28. Celkový počet položiek v množine je 7, teda náš priemer je 4.

Prečo potrebujeme priemer?

Takže v tomto okamihu by vás mohlo zaujímať, prečo by sme aj tak potrebovali nájsť priemer čísla.

Ide o to, že aj samotná štatistika je rozdelená do niekoľkých skupín. Rovnako ako máte nástroje, ktoré sa používajú na prácu s drevom, a iné na prácu s kovom, niektoré nástroje v štatistike sú zoskupené do tried, pretože sa používajú na podobný účel.

Jedna takáto skupina v štatistike sa nazýva súhrnná štatistika. Jednou z vecí, na ktoré sa štatistika používa, je popis údajov. Súhrnná štatistika je kolekcia nástrojov používaných na tento účel. Jednou z položiek v tejto triede nástrojov je priemer.

Priemer je dôležitý kvôli tomu, že nám pomáha analyzovať distribúciu. V štatistike je distribúcia metóda, pomocou ktorej sa pozeráme na premennú, o ktorej chceme mať informácie. Pomocou distribúcie sa pozrieme na hodnoty tejto premennej a na to, ako často sa vyskytuje.

Ak zhromažďujeme údaje, bežným typom distribúcie, ktorú vidíme, je normálne rozdelenie, ktoré má formu zvonovej krivky:

To znamená, že premenná bude mať spoločnú hodnotu, ku ktorej smeruje, ako aj východiskový a konečný bod.

Znamená to, že nám to umožňuje uskutočniť takéto rozdelenie a pozrieť sa na centrálnu tendenciu premennej, čo je bod, v ktorom majú hodnoty premennej tendenciu klastrovať.

Môžeme teda povedať, že stredná hodnota popisuje centrálnu tendenciu distribúcie.

Výpočet priemeru v Pythone

Môžeme manuálne vypočítať priemer, ak máme malú sadu číselných údajov, máme niekoľko hodnôt, s ktorými môžeme pracovať. Keď však máme v sade údajov stovky alebo tisíce hodnôt, je nemožné ich vypočítať ručne.

Pretože Python je jazyk „s batériami“, môžeme to urobiť tak, že použijeme meanfunkciu štatistického modulu v Pythone.

Použime túto meanfunkciu na výpočet priemeru množiny číselných údajov, ktorú sme mali predtým v príspevku:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Náš kód pozostáva zo 4 krokovej postupnosti, ktorú môžeme použiť na výpočet priemeru:

  1. Importujeme štatistický modul, ktorý obsahuje našu priemernú funkciu
  2. Vytvoríme zoznam Python obsahujúci číselnú množinu údajov, z ktorej by sme chceli vypočítať priemer
  3. Vypočítame priemer a výsledok uložíme do premennej, calc_mean
  4. Výstupom je náš vypočítaný priemer, aby sme mohli získať vizuálnu spätnú väzbu

Keď spustíme kód, dostaneme nasledujúci výstup:

Výstupom programu je rovnaká hodnota ako v prípade našich manuálnych výpočtov. Keď pracujeme s veľkými množinami údajov, táto funkcia bude schopná škálovať tak, aby zvládla všetko, čo na ňu môžeme hodiť.

Balenie

V tomto príspevku sme sa pozreli na meanfunkciu v Pythone. Začali sme diskusiou o štatistikách ako celku, potom sme sa hlboko ponorili do priemeru.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

Bezkódové dátové štruktúry a algoritmy - naučte sa DSA bez toho, aby ste napísali jediný riadok kódu Armstrong Subero | Apress Táto kniha vám prináša nový pohľad na algoritmy a dátové štruktúry, úplne bez kódu. Získajte informácie o algoritmoch dátovej štruktúry (DSA) bez toho, aby ste museli otvoriť editor kódu, použiť kompilátor alebo sa pozrieť do integrovaného vývojového prostredia (IDE) .... Armstrong Subero Hľadať Menu Košík V Váš košík je momentálne prázdny. Prihlásenie AccountBookshelf Login Apress Access