BLOGCZEJNalpha

Jak wypada społeczność #polish na tle innych społeczności językowych?

Wstęp

W sieci Steem mamy wiele społeczności językowych (używających języka innego niż angielski). Niektóre z nich są ściśle powiązane z konkretnym krajem (np #polish, #cesky), inne natomiast dotyczą wielu krajów używających danego języka (np #spanish, #deutsch). Sprawdźmy zatem jak jaki sobie społeczność #polish na tle pozostałych.

Dane dotyczą pierwszej połowy roku 2018 (od 01.01.2018 do 30.06.2018) i zostały pobrane z bazy SteemSQL.

W analizie zostały uwzględnione następujące tagi:

  • #indonesia
  • #spanish
  • #aceh
  • #kr
  • #cervantes
  • #cn
  • #deutsch
  • #castellano
  • #venezuela
  • #tr
  • #polish
  • #fr
  • #myanmar
  • #japanese
  • #ru
  • #pt
  • #thai
  • #ua
  • #morocco
  • #arab
  • #pilipinas
  • #steemit-austria
  • #mexico
  • #rusteemteam
  • #cesky
  • #russian
  • #hindi
  • #br
  • #arabic

Znalezienie tych tagów nie było łatwe, bo jak widać mamy tutaj różne konwencje. Tagi zostały wyselekcjonowane ręcznie z listy 1000 najpopularniejszych tagów i następnie poddane dodatkowej weryfikacji.

Post częściowo bazuje na angielskojęzycznej analizie: https://steemit.com/utopian-io/@jacekw.dev/analysis-of-non-english-communities-on-steem, głównie jeśli chodzi o dane i wykresy.

Posty

Pierwszą sprawdzaną metryką jest liczba postów dodanych w badanym okresie.

. Tag Posty
1 spanish 506603
2 indonesia 407362
3 aceh 364128
4 cervantes 336008
5 kr 249492
6 castellano 153505
7 venezuela 130094
8 cn 79019
9 deutsch 77069
10 tr 58423
11 #polish 29788
12 ru 21432
13 japanese 20931
14 fr 20873
15 myanmar 20638
16 ua 18228
17 pt 18212
18 thai 17132
19 morocco 11397
20 steemit-austria 11280
21 arab 9373
22 mexico 6830
23 pilipinas 6441
24 rusteemteam 5873
25 teamukraine 4148
26 cesky 4057
27 russian 3266
28 br 2477
29 hindi 2001
30 arabic 1673

Jak widzimy społeczność #polish plasuje na 11 pozycji. Wyżej znajdują się społeczności używające języków:

  • hiszpańskiego: #spanish, #cervantes, #castellano, #venezuela
  • indonezyjskiego: #indonesia, #aceh
  • koreańskiego: #kr
  • chińskiego: #cn
  • niemieckiego: #deutsch
  • tureckiego: #tr

Wygląda na to, że wynik jest całkiem dobry. Napisaliśmy tylko 3x razy mniej postów niż społeczność chińska, a mamy jednak około 35x mniej ludności :)

Spójrzmy jeszcze na wykresy przedstawiające zmiany w czasie. Dane zostały rozdzielone na 10 tagów na wykres. Oprócz wykresu z tagiem #polish (druga dziesiątka), przedstawiony jest też wykres czołowej dziesiątki.

Pozycje 1-10

Pozycje 11-20

Większość linii przejawia tendencję spadkową, ale jednak linia dotycząca tagu #polish zdaje się ten trend przełamywać. Trzeba wejść do pierwszej dziesiątki, chociaż nie ma co ukrywać, że różnica do odrobienia jest spora.

Suma nagród

Teraz czas na sumę nagród. Jak widać zajmujemy 17 pozycję, niemniej przeskoczenie o choćby 1-2 oczka w górę nie wydaje się być zbyt trudne, bo różnica jest niewielka.

. Tag Suma nagród autorskich
1 kr 346032
2 spanish 286315
3 cervantes 194563
4 cn 159464
5 deutsch 97971
6 indonesia 97138
7 castellano 82621
8 tr 64475
9 aceh 57992
10 venezuela 38036
11 fr 37928
12 japanese 29508
13 pt 26778
14 steemit-austria 24372
15 ru 21037
16 myanmar 19279
17 #polish 19049
18 ua 16448
19 morocco 12993
20 thai 12330
21 mexico 10204
22 arab 9940
23 br 8826
24 cesky 4375
25 pilipinas 3443
26 rusteemteam 3071
27 hindi 1326
28 russian 847
29 teamukraine 790
30 arabic 528

Na wykresie czasowym okazuje się, że jeśli spojrzymy tylko na ostatni miesiąc to zajmujemy pozycję 15 i mamy silną tendencję rosnącą, co na pewno cieszy.


Średnia nagroda na post

Możemy też sprawdzić jaka jest średnia nagroda jaką otrzymuje post. Oprócz średniej warto spojrzeć też na inne miary: medianę oraz odchylenie standardowe. Mediana mówi mam jaka nagroda byłaby pośrodku jeśli uszeregowalibyśmy je od najmniejszej do największej. Odchylenie standardowe natomiast określa jak duże jest zróżnicowanie nagród. Im wartość niższa tym nagrody są bardziej wyrównane.

. Tag Średnia Mediana Odchylenie std.
1 br 3.563 0.357 9.307
2 steemit-austria 2.161 0.593 5.612
3 cn 2.018 0.059 7.029
4 fr 1.817 0.108 5.610
5 mexico 1.494 0.033 8.981
6 pt 1.470 0.334 4.769
7 japanese 1.410 0.400 3.350
8 kr 1.387 0.281 3.424
9 deutsch 1.271 0.086 4.124
10 morocco 1.140 0.608 2.660
11 tr 1.104 0.068 5.779
12 cesky 1.078 0.162 2.642
13 arab 1.060 0.306 2.516
14 ru 0.982 0.084 3.262
15 myanmar 0.934 0.154 2.298
16 ua 0.902 0.154 2.477
17 thai 0.720 0.562 1.237
18 hindi 0.663 0.004 2.628
19 #polish 0.639 0.047 1.911
20 cervantes 0.579 0.022 2.516
21 spanish 0.565 0.023 2.609
22 castellano 0.538 0.048 2.162
23 pilipinas 0.535 0.165 1.133
24 rusteemteam 0.523 0.113 1.228
25 arabic 0.316 0.008 2.449
26 venezuela 0.292 0.011 1.668
27 russian 0.259 0.042 1.753
28 indonesia 0.238 0.010 1.186
29 aceh 0.159 0.007 0.880

Pozycje 1-10

Pozycje 11-20

Na wykresie widzimy systematyczny wzrost, jednak jest on nieco niemrawy :)

Autorzy

Bardzo ważną metryką wydaje się też być liczba unikalnych autorów piszących w danym tagu. Tutaj, podobnie jak w przypadku liczby postów, społeczność #polish zajmuje 11 miejsce.

. Tag Authors
1 spanish 22315
2 indonesia 20511
3 aceh 19852
4 cervantes 13775
5 kr 13761
6 venezuela 10520
7 castellano 7052
8 cn 5451
9 deutsch 4497
10 tr 3496
11 #polish 2488
12 japanese 2020
13 mexico 1468
14 fr 1450
15 myanmar 1409
16 thai 1070
17 ru 1051
18 pt 799
19 russian 666
20 arab 646
21 morocco 590
22 pilipinas 475
23 hindi 469
24 steemit-austria 401
25 arabic 342
26 ua 330
27 rusteemteam 210
28 br 191
29 cesky 132
30 teamukraine 27

Pozycje 1-10

Pozycje 11-20

Patrząc na wykres - jest w kratkę. W niektórych miesiącach liczba aktywnych autorów rośnie, a w innych z kolei maleje.

Tagi z prefiksami

Można zaryzykować stwierdzenie, że dojrzałe społeczności posiadają wypracowany schemat tagowania, tak aby posty danego języka nie trafiały niepotrzebnie do odbiorców angielskojęzycznych. Sprawdźmy jakie inne społeczności korzystają z takiej samej konwencji jak stosowana u nas. Jak się okazuje zajmujemy wysokie drugie miejsce, pomiędzy Koreańczykami i Chińczykami.

. Prefiks Liczba unikalnych tagów
1 kr 2302
2 pl 815
3 cn 221
4 ru 168
5 jp 64
6 de 31
7 tr 24
8 pt 12
9 fr 8
10 ua 5
11 es 5

Możemy jeszcze sprawdzić jaka jest popularność polskich tagów prefiksowych.

. Tag Liczba użyć
10 #pl-artykuly 5987
30 #pl-fotografia 1612
51 #pl-blog 910
53 #pl-kuchnia 880
55 #pl-gry 839
56 #pl-sport 813
58 #pl-kryptowaluty 796
62 #pl-emocjonalnie 682
63 #pl-muzyka 681
65 #pl-historia 636
72 #pl-zdrowie 539
75 #pl-bitcoin 527
79 #pl-tradycja 473
83 #pl-sztuka 453
86 #pl-podroze 433
88 #pl-ciekawostki 418
90 #pl-filmy 408
92 #pl-nauka 393
98 #pl-steem 372

Jak widać, tag #pl-artykuly zajmuje 10 miejsce (wszystkie pozycje na szczycie tabeli są okupowane przez tagi koreańskie). Inne tagi też plasują się na stosunkowo wysokich pozycjach.

Użyte narzędzia

KOMENTARZE

  • lokibalboa

    Czytałem to samo po angielsku. Up w ciemno (chyba jasno raczej, bo treść znam😆😁) za dobrą robotę :)

  • grecki-bazar-ewy

    Świetna robota @jacekw! :)

    Jak dobrze że rozwiałeś wątpliwości bo ostatnio w wielu komentarzach czytałam że nasza społeczność jest bardzo biedna i plasuje się gdzieś na szarym końcu...

    Że nie wspomnę o innych niemiłych komentarzach skierowanych przeciwko rzekomej "elicie na #polish"... a tu proszę, czarno na białym widać że ta krytykowana często "elita" zrobiła jednak kawał dobrej roboty.

  • who-knock

    Moje sugestie:

    "Wygląda na to, że wynik jest całkiem dobry. Napisaliśmy tylko 3x razy mniej postów niż społeczność chińska, a mamy jednak około 35x mniej ludności :)"

    Uważałbym z wyciąganiem wniosków wynikających z takiego porównania, ze względu na istotną różnice kulturową a także częściowo zamknięty/wewnętrzny system bądź co bądź komunistycznych Chin.

    "Średnia nagroda na post"

    Wyniki w mojej opinii nie są zbyt wiarygodne lub raczej są zbyt abstrakcyjne na co wskazuje spory variance w stosunku do średniej i mediany.
    W mojej opinii wynika to z różnic w poziomach użytkowników a także pustych/nieaktywnych kont.

    Wydaje mi się, że warto podzielić wyniki na takie " fasolki ;)" 30-50, 50-60, >60 - wtedy average i mediana staja się bardziej wymierne.

    Dobra robota!

  • ptaku

    Od początku mojego krótkiego pobytu na Steemit, jestem pod ogromnym wrażeniem Twojej pracy. Statystyki nigdy mnie zbytnio nie interesowały, ale tu dostaje informacje w bardzo prostej i czytelnej odsłonie.
    Świetna robota - dzięki!

  • wzp

    pl-artykuly na 10 miejscu to można powiedzieć nawet bardzo dobrze. Teraz pozostaje skrzyknąć chłopaków i pl-wedkarstwo wyprowadzić tak aby w jakiejkolwiek statystyce światowej się pojawiło :)

  • kusior

    Świetna robota! A te statystyki cieszą, ale też i mobilizują do dalszego działania.

  • flagfixer

    @jacekw you were flagged by a worthless gang of trolls, so, I gave you an upvote to counteract it! Enjoy!!

  • deepresearch

    https://steemit.com/pl-artykuly/@deepresearch/steemit-wycena-sieci-optymalna-dystrybucja-glosow

    Mam garść przemyśleń po tym wpisie. Zapraszam do dyskusji.