Kategoria: Pakiet opracowań prof. A.K. Wróblewskiego
Odsłon: 8184

Andrzej Kajetan Wróblewski

Nauka w Polsce według rankingów
bibliometrycznych

1. Podstawowe informacje o bazach danych

W 1992r. filadelfijski Institute of Scientific Information (ISI) ogłosił po raz pierwszy bazę National Science Indicators (NSI) i od tego czasu corocznie są wydawane jej kolejne, wzbogacone wersje. Od niedawna ISI nosi nazwę Thomson Institute. Najnowsze wydanie bazy NSI z 2004r. Obejmuje publikacje i cytowania za okres 1981-2003. Baza NSI jest obecnie oparta na danych z prawie 9000 najważniejszych czasopism tworzących tzw. listę filadelfijską. Około 2/3 czasopism na tej liście dotyczy nauk matematyczno-przyrodniczych i technicznych, a reszta- nauk społecznych, humanistycznych i sztuki. Kolejne edycje bazy NSI są coraz obszerniejsze (patrz ryc.1).

Nauka2005r1

Ryc.1. Liczba publikacji dodawanych każdego roku do bazy National Science Indicators

Baza NSI za lata 1981-2003 obejmuje już prawie 14 mln publikacji i około 180 mln cytowań. Te publikacje i cytowania są przyporządkowane ponad 170 krajom i regionom geograficznym (np. Ameryka łacińska, Unia Europejska) na podstawie narodowości autorów, a dokładniej – na podstawie podanej w publikacji afiliacji.

Przypomnę, że w NSI, podobnie jaw w innych międzynarodowych bazach danych, stosuje się zasadę integer counting: jeżeli jakaś publikacja naukowa ma autorów z więcej niż jednego państwa, to w bazie danych zostaje zaliczana każdemu z tych państw z tą samą jednostkową wagą. Stosowanie ułamków wprowadziłoby wielkie i nie potrzebne komplikacje. Jednakże korzystanie z baz danych wymaga zrozumienia ich zawartości i wprowadzania odpowiedniej normalizacji. Przykładowo, powstała w instytucji amerykańskiej publikacja, której współautorem jest polski uczony, przebywający tam choćby czasowo (on leave), jest w całości zaliczana do dorobku USA. Gdyby natomiast ten współautor występował w publikacji z podaniem polskiej afiliacji, to ta publikacja zaliczona byłaby z jednakową, jednostkową wagą do dorobku USA, jak i Polski. Efektem takiego sposobu tworzenia bazy NSI jest to, że dodając do siebie liczby publikacji dla wszystkich państw, otrzymujemy wartość przewyższającą łączną liczbę publikacji na świecie- a ta nadwyżka jest miarą intensywności współpracy międzynarodowej. Wyjaśniałem te sprawy dokładniej w artykule [2], do którego odsyłam czytelników po dalsze informacje.

W NSI nie ma nazwisk autorów ani nazw instytucji, z których pochodzą. Istnieją dwie wersje tej bazy, tzw. NSI Standard i NSI Deluxe. Różnią się one wyraźnie zawartością (i ceną). Publikacje i cytowania w bazie NSI Standard obejmują 24 dziedziny: nauki biologiczno- medyczne, matematyczno- fizyczne, przyrodnicze, techniczne oraz ekonomię, prawo, edukację, psychologię i nauki społeczne; jedna z kategorii to tzw. Badania multidyscyplinarne, do której autorzy bazy zaliczają publikacje z pogranicza dyscyplin. Wersja NSI Deluxe obejmuje dodatkowo 10 dziedzin nauk humanistycznych, społecznych i sztuki, a ponadto dla 16 dziedzin objętych przez NSI Standard podano w niej dokładniejszy podział dyscypliny, tak że łącznie mamy tu podział publikacji i cytowań na 105 pól badawczych, odpowiadających konwencji „Current Contents”.

Dziedziny badawcze i pola badawcze w NSI zostały zdefiniowane jako zbiór publikacji ogłoszonych w określonym zestawie czasopism rejestrowanych w jednej z siedmiu edycji „Current Contents” oraz indeksach cytowań. Niektóre pola stworzone na potrzeby NSI nie mają swojego odpowiednika w innych klasyfikacjach nauk. Podział publikacji do odpowiednich kategorii następuje zatem głównie na podstawie przyporządkowania im czasopism, w których znajdują się publikacje i cytowania. W nielicznych przypadkach czasopismo przyporządkowało dwóm (lub nawet trzem) kategoriom, a klasyfikację publikowanych artykułów wykonywano indywidualnie. Prace ogłaszane w czasopismach wielodyscyplinowych (jak „Nature”, „Science” itp.) były przydzielane indywidualnie do odpowiednich kategorii.

Trzeba koniecznie wiedzieć, żę zasada tworzenia NSI jet inna niż dla Science Cictation Index, na którym jest oparta. W SCI rejestrowane są wszystkie cytowania zamieszczone w obecnie publikowanych pracach (w czasopismach objętych rejestrem SCI), można więce tam, na przykład, znaleźć nadal cytowania (wprawdzie nieliczne) dawnych prac Newtona czy Einsteina. Natomiast w NSI rejestruje się tylko cytowania do prac zarejestrowanych w tej bazie, a więc opublikowanych przed 1981 rokiem nie wchodzą do tej bazy. Baza NSI jest skonstruowana tak, jakby świat powstał dopiero w 1981r.

Bardzo istotne jest ponadto to, że baza NSI podaje tylko cytowania prac opublikowanych w danym roku. Tak więc, pytając o liczbę cytowań odnoszących się np. do 1990r. Odnajdziemy wszystkie cytowania znalezione w okresie 1990-2003 prac opublikowanych w 1990r.

Przypomnę tu podstawową regułę bibliometrii: im większa próbka, tym bardziej wiarygodne wyniki. Ponieważ baza NSI obejmuje ogromną liczbę prac i cytowań, więc wyciągane z niej wnioski dotyczące całych krajów czy dziedzin nauki są znaczące statystycznie i można uznać je za wiarygodne. Są to wnioski bardzo istotne. Przykładowo, z bazy NSI można się dowiedzieć o znacznych różnicach w cytowaniach prac w poszczególnych dziedzinach. Można także bezpiecznie wyciągać wnioski na temat trendów czasowych i miejsca poszczególnych państw w rankingu światowym.

Przy okazji przypomnę także, że wyniki bibliometryczne uzyskiwane z innych baz danych (np. Science Citation Index albo National Citation Report) należy traktować inaczej. I tak , wyniki dotyczące całych instytucji czy centrów naukowych są tylko w przybliżeniu wiarygodne, natomiast wyniki dotyczące poszczególnych badaczy są bardzo mało wiarygodne i należy do nich podchodzić z dużą ostrożnością. Próby klasyfikacji badaczy na podstawie liczby ich publikacji czy cytowań muszą być podejmowane tylko z najwyższą rozwagą, a bezrozumne posługiwanie są wskaźnikami typu impact factor powinno być całkowicie zarzucone.

Zainteresowanych szczegółami odsyłam do obszernego artykułu „instruktażowego” [3].

2. Rankingi liczby publikacji

Przedstawię teraz dane dotyczące Polski. Na rycinie 2 przedstawiona jest liczba prac, które mają polskich autorów lub współautorów, rejestrowana każdego roku w bazie NSI. Liczba ta systematycznie rośnie (na wykresie widoczne jest także załamanie wywołane wprowadzeniem stanu wojennego). Trochę inaczej przedstawia się procentowy udział Polski w liczbie publikacji naukowych.

Nauka2005r2

Ryc. 2. Liczba publikacji z autorami lub współautorami z Polski,
dodawanych każdego roku do bazy National Science Indicators

Nauka2005r3

Ryc. 3. Procentowy wkład Polski do światowej bazy publikacji

Jak widać na rycinie 3, w latach 1980-1993 udział ten powoli spadał (wtedy liczba prac z Polski rosła wolniej od średniej światowej), ale spadek ten został zahamowany i od 1997 roku obserwujemy systematyczny wzrost. Wkład Polski do nauki światowej, mierzony liczbą publikacji naukowych, wynosi obecnie już prawie 1,17% (patrz tabela1).

Wydaje się, że jest to efekt wysiłków podejmowanych w KBN w celu przekonania polskich naukowców, aby publikowali swe prace w czasopismach wyróżnionych listą filadelfijską.

Tabela 1. Ranking według liczby publikacji w 2003r.

Państwo Procent
publikacji
1 USA 26,780
2 Japonia 7,567
3 UK 7,057
4 Niemcy 6,834
5 Francja 4,938
6 Chiny 4,081
7 Kanada 3,646
8 Włochy 3,558
9 Hiszpania 2,480
10 Rosja 2,450
11 Australia 2,322
12 Holandia 2,078
13 Indie 2,010
Państwo Procent
publikacji
14 Korea Płd. 1,877
15 Szwecja 1,579
16 Szwajcaria 1,508
17 Brazylia 1,270
18 Tajwan 1,242
19 Polska 1,166
20 Belgia 1,132
21 Izrael 1,048
22 Turcja 0,997
23 Dania 0,839
11 Austria 0,811
12 Finlandia 0,782
SUMA 90,052

Nauka2005r4

Ryc. 4. Procent prac z polskimi autorami (uwaga: wskutek zasady integer counting
w bazie NSI suma wkładów poszczególnych państw przekracza 100%).

Natomiast na rycinie 4 został przedstawiony procentowy udział prac z polskimi autorami. Ze względu na wyjaśnioną wyżej zasadę tworzenia bazy, przedstawione tu liczby są wyraźnie większe od tych z ryciny 3. Tu także jest wyraźna tendencja wzrostowa. Obecnie już około 1,4% publikacji naukowych ma autorów lub współautorów z Polski.

Rankingi bibliometryczne wzbudzają co pewien czas spore emocje, kiedy z okazji publikacji ich wyników w poczytnych periodykach, jak np. „Nature” [4], interesuje się tym zagadnieniem nawet prasa codzienna.

Wzrost naszego udziału w liczbie publikacji jest pocieszający, ale mniej optymistyczne wnioski płyną z porównania z innymi państwami.

Nauka2005r5

Ryc. 5. Porównanie wkładu publikacji z Polski, Korei i Turcji

Na rycinie 5 widać, że tempo wzrostu Korei jest znacznie większe (Korea wyprzedziła Polskę w rankingu w 1997r.), a dużo szybciej rośnie też udział Turcji. Jest ona obecnie za nami, ale przypuszczalnie już za rok, dwa wyprzedzi Polskę. Podobne dane są przedstawione na rycinie 6. Chiny, które na początku lat 80. XX w. były daleko za Polską, rozwijają się niezmiernie szybko i obecnie są już w nauce potęgą światową.

W tabeli 1 podane są wkłady pierwszych 25 państw, które łącznie dają ponad 90% światowej „produkcji” publikacji.

W 1981r. Polska zajmowała wysokie, 15. miejsce w rankingu światowym pod względem liczby publikacji. Niestety, systematyczne niedofinansowanie nauki w Polsce spowodowało, że przez 20 lat systematycznie staczaliśmy się na coraz niższe miejsce (patrz ryc. 7).

W 1999r. Spadliśmy aż na 21. miejsce. Na szczęście od tego czasu odrabiamy straty i przesunęliśmy się już na miejsce 19. Niestety, chyba przyjdzie nam znów spaść o jedno miejsce, bo – jak przedstawiono wyżej- nauka w Turcji rozwija się znacznie szybciej niż w Polsce i nas wyprzedzi.

Nauka2005r6

Ryc. 6. Porównanie szybkości wzrostu liczby z Polski, Brazylii i Chin

Nauka2005r7

Ryc. 7. Miejsce zajmowane przez Polskę w rankingu krajów
pod względem liczby publikacji w bazie NSI.

Poszczególne dyscypliny naukowe rozwijają się w Polsce niejednakowo i zajmują różne miejsca w rankingach światowych. Najbliżej czołówki światowej są od dawna nauki ścisłe: astronomia, chemia, fizyka i matematyka oraz materiałoznawstwo (do którego znaczny wkład daje fizyka i chemia). Te dziedziny utrzymują się na początku drugiej dziesiątki, tuż za światowymi mocarstwami. W 1981 r. w czołówce światowej były także nauki inżynierskie (12. miejsce), ale od tego czasu obserwuje się systematyczny regres tej dziedziny. Podobnie niestety wygląda pozycja naszej informatyki.

Dużo gorzej wypadają w tym rankingu nauki biologiczne i medyczne, które zajmują miejsce w trzeciej dziesiątce państw. Pozycje poszczególnych dziedzin nauki w rankingu liczby publikacji pokazują tabela 2 oraz ryciny 8-10.

Tabela 2. Miejsca poszczególnych dziedzin polskich nauk ścisłych i technicznych
według liczby publikacji w rankingu światowym
(podział na dziedziny i ich nazwy pochodzą od twórców bazy NSI)

Dziedzina 2003 1998-2002 1993-1997 1981
Fizyka 12 12 13 11
Matematyka 12 13 13 14
Chemia 13 12 12 10
Materiałoznawstwo 14 16 18 11
Nauki o roślinach i zwierzętach 14 17 23 17
Astrofizyka 15 16 16 25
Ekologia i środowisko 20 24 27 20
Biologia i biochemia 20 21 19 18
Farmakologia 22 22-23 21 18-19
Nauki inżynierskie 23 23 18 12
Biologia molekularna i genetyka 23 23 23 20
Informatyka 23 27 27 13
Immunologia 23 25 24 20
Neurologia 23-24 23 19 16-17
Nauki rolnicze 25 28 29 26
Medycyna kliniczna 26 30 32 23
Nauki o ziemi 29 30 26 26
Mikrobiologia 28 31-32 33 20

W naukach humanistycznych i społecznych najlepiej wypada od lat historia, najgorzej zaś edukacja (tabela 3). Spadek tej ostatniej dziedziny w rankingu światowym jest wręcz kompromitujący, gdyż okazuje się , że w ciągu minionych 5 lat wszyscy jej przedstawiciele w Polce zdołali opublikować tylko 3 (słownie: trzy) publikacje w znaczących periodykach światowych. Obecnie polska edukacja sąsiaduje w tym rankingu ze słabo rozwiniętymi krajami trzeciego świata.

Nauka2005r8

Ryc. 8. Miejsca zajmowane przez chemię oraz nauki techniczne

Nauka2005r9

Ryc. 9. Miejsca zajmowane przez fizykę oraz biologię molekularną z genetyką

Nauka2005r10

Ryc. 10. Miejsca zajmowane przez matematykę i informatykę

Tabela 3. Miejsca poszczególnych polskich nauk humanistycznych
i społecznych w rankingu światowym

Dziedzina 1998-2002 1993-1997 1981
Historia 16 15 12-13
Studia klasyczne 17 18 19-26
Architektura i sztuka 19 18 28-33
Archeologia 19 22 11-12
Językoznawstwo 22 21 15-17
Sztuki wykonawcze 25 31 10
Filozofia 26 22 34-36
Religia i teologia 26 24 22-26
Prawo 28-31 25 16-19
Humanistyka (ogólne) 30 36 16-17
Literaturoznawstwo 31 28 32-36
Nauki społeczne 34 34 24-25
Ekonomia i zarządzanie 35 30 34-37
Psychologia i psychiatria 35 33 21
Edukacja 61-68 37 18-23

3. Rankingi cytowań

Wypada tu przypomnieć, że średnie liczby cytowań jednej publikacji w różnych dziedzinach są bardzo zróżnicowane (tabela 4), dlatego też jedyne sensowne porównywanie dziedzin to właśnie odniesienie do średniej światowej w poszczególnych dziedzinach.

Tabela 4. Średnia liczba cytowań jednej publikacji w różnych dziedzinach, znormalizowana do średniej liczby cytowań z architektury i sztuki, przyjętej za jednostkę.
(Nazwy dziedzin pochodzą z NSI)

Nazwa dziedziny w NSI Cytowalność
Architektura i sztuka 1
Literaturoznawstwo 1,6
Sztuki wykonawcze 2,6
Religia i teologia 3,4
Studia klasyczne 3,5
Historia 4,3
Filozofia 4,4
Językoznawstwo 5,7
Humanistyka - ogólne 6,7
Archeologia 11,2
Edukacja 12,4
Informatyka 16,8
Nauki inżynierskie 16,7
Nauki społeczne 18,2
Matematyka 18,9
Materiałoznawstwo 20,2
Prawo 21,3
Nauki Rolnicze 21,4
Badania multidyscyplinarne 23,3
Ekonomia i zarządzanie 25,3
Nauka o roślinach i zwierzętach 28,6
Ekologia/środowisko 34,2
Fizyka 34,8
Chemia 35,5
Nauka o ziemi 39,4
Psychologia i psychiatria 41,1
Farmakologia 44,3
Medycyna kliniczna; w tym: 45,1
ortopedia 17,8
onkologia 74,2
Astrofizyka 61,2
Mikrobiologia 64,1
Biologia i biochemia 75,2
Neurologia 78,8
Immunologia 96,4
Biologia i genetyka 115,7
(w tym biologia komórki) 136,7

Dane dotyczące różnic cytowań w różnych dziedzinach nauki musi znać każdy, kto chciałby wyciągać jakieś wnioski bibliometryczne dla tych dziedzin. Porównanie bezwzględnej liczby cytowań bez uwzględniania poprawek byłoby mylące. Nie można przecież tego czynić, skoro, na przykład, średnia liczba cytowań jednej pracy z biologii komórki jest ponad 135 razy większa niż dla pracy z architektury i sztuki.

Jeśli chodzi o cytowalność polskich publikacji, to sytuacja jest pocieszająca. O ile na początku lat 80. średnia liczba cytowań polskich publikacji niewiele przekraczała 40% średniej światowej, to obecnie jest to już około 70% tej średniej i wskaźnik ten systematycznie rośnie (ryc. 11).

Nauka2005r11

Ryc. 11. Średnia liczba cytowań polskich publikacji w procentach średniej światowej

Nauka2005r12

Ryc. 12. Średnia liczba cytowań polskich publikacji z poszczególnych dziedzin
(w procentach średniej światowej dla danej dziedziny). Dane dotyczą lat 1999-2003

Jeśli chodzi o cytowalność w poszczególnych dziedzinach (ryc. 12), to najlepiej znów wypadają nauki ścisłe, astrofizyka (93% średniej światowej) i fizyka (91%). Tu nieco gorzej wypada matematyka (75%) i chemia (65%), natomiast bardzo dobrze – nauki inżynieryjne (90%) średniej światowej) i medycyna kliniczna (84%). Pozostałe nauki biomedyczne zajmują miejsca na końcu takiej klasyfikacji: w najwyżej stojącej neurologii jest to tylko 52%, a w najgorszej, mikrobiologii – tylko 38% średniej światowej.

Słaba pozycja naszych dyscyplin biomedycznych w rankingu cytowań jest powodem tego, że Polska wypada dość słabo w ogólnej klasyfikacji pod względem przeciętnej liczb cytowań jednej pracy (bez podziału na dziedziny). Wyjaśniłem te sprawy dokładnie w artykule [3]. Struktura naszej nauki jest taka, że większość publikacji w bazie NSI jest z dziedzin ścisłych, których cytowalność (patrz tabela 4) jest wyraźnie niższa niż dziedzin biomedycznych. W krajach najbardziej rozwiniętych naukowo większość publikacji pochodzi właśnie z wysoko cytowanych dziedzin biomedycznych. W rezultacie nauki biomedyczne dają tylko 30% wkładu do cytowalności publikacji z Polski, podczas gdy np. dla USA jest to aż 66%. Wniosek z tego jest prosty: nasza pozycja w rankingu publikacji i cytowań ulegnie znaczącej poprawie tylko wtedy, jeśli znacznie zintensyfikujemy w Polsce badania w dziedzinach biomedycznych. Zresztą kwestie bibliometryczne nie są jedynym argumentem, że tak należy postąpić, ponieważ powszechnie się uważa, że właśnie w naukach biometrycznych trzeba upatrywać znaczących odkryć i dźwigni postępu.

Nauka2005r13

Ryc. 13. Liczba publikacji z poszczególnych krajów członkowskich OECD w funkcji nakładów
na badania w dolarach PPP (parytetu siły nabywczej). Dane dotyczą 2002r.

4. Koszty a wyniki

Jeśli uwzględnimy fakt, że od piętnastu lat nauka w Polsce jest systematycznie niedofinansowana, to wyniki naszych badaczy wypadają zupełnie nieźle. Przedstawiam tu dane na podstawie opracowań statystycznych OECD, gdyż tylko dla krajów członkowskich tej organizacji nakłady na badania (za 2002r.) zostały przedstawione w jednolitej formie [5]. Zestawienie tych danych z informacjami z bazy NSI pozwala ocenić efektywność badań w różnych krajach.

Na rycinie 13 przedstawiona jest liczba publikacji w funkcji nakładów na badania. Jak widać, wynik Polski jest wyraźnie lepszy od tego, którego można by oczekiwać z ogólnego trendu danych. Inaczej mówiąc, nasz publikacje kosztują mniej niż w większości innych krajów OECD, co jeszcze wyraźniej widać na rycinie 14.

Nauka2005r14

Ryc. 14. Przeciętny koszt jednej publikacji z krajów członkowskich OECD
w dolarach PPP (parytetu siły nabywczej). Dane dotyczą roku 2002

Ryciny 15 i 16 przedstawiają korelacje liczby publikacji i zatrudnionych badaczy oraz związku cytowań z kosztami publikacji.

Nauka2005r15

Ryc. 15. Zależność liczby publikacji na jednego badacza od przypadających na niego nakładów
w dolarach PPP (parytetu siły nabywczej). Dane dotyczą krajów OECD w 2002r. Poszczególne kraje zostały oznaczone symbolami takimi jak ich tablice rejestracyjne samochodów

Nauka2005r16

Ryc. 16. Zależność średniej liczby cytowań od kosztów publikacji dla krajów członkowskich OECD. Dane dotyczą roku 2002

Podsumowanie

Z przedstawionych danych wynika, że pod względem wskaźników bibliometrycznych najwyżej w rankingu światowym plasuje się obecnie (2003r.) polska fizyka (12. miejsce w liczbie publikacji, cytowania na poziomie 91% średniej światowej). Za nią są matematyka (12. miejsce w liczbie publikacji i cytowania na poziomie 75% średniej światowej) i chemia (13. miejsce w liczbie publikacji i cytowania na poziomie 65% średniej światowej). Nauka o materiałach zajmuje miejsce 14. w liczbie publikacji, ale ma cytowalność tylko 54% średniej światowej. Astrofizyka ma największą ze wszystkich cytowalność (93% średniej światowej), ale zajmuje dopiero 15. miejsce w liczbie publikacji. Z dziedzin humanistyczno- społecznych plasująca się najwyżej historia (14. miejsce w liczbie publikacji) ma bardzo niską cytowalność, zaledwie 20% średniej krajowej.

Bibliografia

[1] K. Stępień, Astronomia z astrofizyką w Polsce u progu XXI wieku, Nauka 4/2004, s. 105.

[2] A.K. Wróblewski, Efektywność współpracy międzynarodowej w nauce, Nauka 2000, nr 2, s. 71-77.

[3] A.K. Wróblewski, Bibliometryczna trylogia, „Zagadnienia Naukoznawstwa” 2002, nr 1-2, s. 7-29.

[4] D.A. King, The scientific impact of nations, „Nature” 2004, t. 430, s. 311.

[5] OECD in Figures, OECD Paris, July 2004.

The position of Polich science and its different disciplines in bibliometric rankings (publications and citations) is presented on the basis of the National Science Indicators (NSI) database covering the years 1981-2003.

Key words: Polish scuence, bibliometric rankings, National Science Indicators.

O autorze

Prof. dr hab. Andrzej Kajetan Wróblewski, członek rzeczywisty PAN, Wydział Fizyki Uniwersytetu Warszawskiego, e-mail: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript..

Cały artykuł można pobrać tu ikon_pobierz