Andrzej Kajetan Wróblewski
Nauka w Polsce według rankingów
bibliometrycznych
1. Podstawowe informacje o bazach danych
W 1992r. filadelfijski Institute of Scientific Information (ISI) ogłosił po raz pierwszy bazę National Science Indicators (NSI) i od tego czasu corocznie są wydawane jej kolejne, wzbogacone wersje. Od niedawna ISI nosi nazwę Thomson Institute. Najnowsze wydanie bazy NSI z 2004r. Obejmuje publikacje i cytowania za okres 1981-2003. Baza NSI jest obecnie oparta na danych z prawie 9000 najważniejszych czasopism tworzących tzw. listę filadelfijską. Około 2/3 czasopism na tej liście dotyczy nauk matematyczno-przyrodniczych i technicznych, a reszta- nauk społecznych, humanistycznych i sztuki. Kolejne edycje bazy NSI są coraz obszerniejsze (patrz ryc.1).
Ryc.1. Liczba publikacji dodawanych każdego roku do bazy National Science Indicators
Baza NSI za lata 1981-2003 obejmuje już prawie 14 mln publikacji i około 180 mln cytowań. Te publikacje i cytowania są przyporządkowane ponad 170 krajom i regionom geograficznym (np. Ameryka łacińska, Unia Europejska) na podstawie narodowości autorów, a dokładniej – na podstawie podanej w publikacji afiliacji.
Przypomnę, że w NSI, podobnie jaw w innych międzynarodowych bazach danych, stosuje się zasadę integer counting: jeżeli jakaś publikacja naukowa ma autorów z więcej niż jednego państwa, to w bazie danych zostaje zaliczana każdemu z tych państw z tą samą jednostkową wagą. Stosowanie ułamków wprowadziłoby wielkie i nie potrzebne komplikacje. Jednakże korzystanie z baz danych wymaga zrozumienia ich zawartości i wprowadzania odpowiedniej normalizacji. Przykładowo, powstała w instytucji amerykańskiej publikacja, której współautorem jest polski uczony, przebywający tam choćby czasowo (on leave), jest w całości zaliczana do dorobku USA. Gdyby natomiast ten współautor występował w publikacji z podaniem polskiej afiliacji, to ta publikacja zaliczona byłaby z jednakową, jednostkową wagą do dorobku USA, jak i Polski. Efektem takiego sposobu tworzenia bazy NSI jest to, że dodając do siebie liczby publikacji dla wszystkich państw, otrzymujemy wartość przewyższającą łączną liczbę publikacji na świecie- a ta nadwyżka jest miarą intensywności współpracy międzynarodowej. Wyjaśniałem te sprawy dokładniej w artykule [2], do którego odsyłam czytelników po dalsze informacje.
W NSI nie ma nazwisk autorów ani nazw instytucji, z których pochodzą. Istnieją dwie wersje tej bazy, tzw. NSI Standard i NSI Deluxe. Różnią się one wyraźnie zawartością (i ceną). Publikacje i cytowania w bazie NSI Standard obejmują 24 dziedziny: nauki biologiczno- medyczne, matematyczno- fizyczne, przyrodnicze, techniczne oraz ekonomię, prawo, edukację, psychologię i nauki społeczne; jedna z kategorii to tzw. Badania multidyscyplinarne, do której autorzy bazy zaliczają publikacje z pogranicza dyscyplin. Wersja NSI Deluxe obejmuje dodatkowo 10 dziedzin nauk humanistycznych, społecznych i sztuki, a ponadto dla 16 dziedzin objętych przez NSI Standard podano w niej dokładniejszy podział dyscypliny, tak że łącznie mamy tu podział publikacji i cytowań na 105 pól badawczych, odpowiadających konwencji „Current Contents”.
Dziedziny badawcze i pola badawcze w NSI zostały zdefiniowane jako zbiór publikacji ogłoszonych w określonym zestawie czasopism rejestrowanych w jednej z siedmiu edycji „Current Contents” oraz indeksach cytowań. Niektóre pola stworzone na potrzeby NSI nie mają swojego odpowiednika w innych klasyfikacjach nauk. Podział publikacji do odpowiednich kategorii następuje zatem głównie na podstawie przyporządkowania im czasopism, w których znajdują się publikacje i cytowania. W nielicznych przypadkach czasopismo przyporządkowało dwóm (lub nawet trzem) kategoriom, a klasyfikację publikowanych artykułów wykonywano indywidualnie. Prace ogłaszane w czasopismach wielodyscyplinowych (jak „Nature”, „Science” itp.) były przydzielane indywidualnie do odpowiednich kategorii.
Trzeba koniecznie wiedzieć, żę zasada tworzenia NSI jet inna niż dla Science Cictation Index, na którym jest oparta. W SCI rejestrowane są wszystkie cytowania zamieszczone w obecnie publikowanych pracach (w czasopismach objętych rejestrem SCI), można więce tam, na przykład, znaleźć nadal cytowania (wprawdzie nieliczne) dawnych prac Newtona czy Einsteina. Natomiast w NSI rejestruje się tylko cytowania do prac zarejestrowanych w tej bazie, a więc opublikowanych przed 1981 rokiem nie wchodzą do tej bazy. Baza NSI jest skonstruowana tak, jakby świat powstał dopiero w 1981r.
Bardzo istotne jest ponadto to, że baza NSI podaje tylko cytowania prac opublikowanych w danym roku. Tak więc, pytając o liczbę cytowań odnoszących się np. do 1990r. Odnajdziemy wszystkie cytowania znalezione w okresie 1990-2003 prac opublikowanych w 1990r.
Przypomnę tu podstawową regułę bibliometrii: im większa próbka, tym bardziej wiarygodne wyniki. Ponieważ baza NSI obejmuje ogromną liczbę prac i cytowań, więc wyciągane z niej wnioski dotyczące całych krajów czy dziedzin nauki są znaczące statystycznie i można uznać je za wiarygodne. Są to wnioski bardzo istotne. Przykładowo, z bazy NSI można się dowiedzieć o znacznych różnicach w cytowaniach prac w poszczególnych dziedzinach. Można także bezpiecznie wyciągać wnioski na temat trendów czasowych i miejsca poszczególnych państw w rankingu światowym.
Przy okazji przypomnę także, że wyniki bibliometryczne uzyskiwane z innych baz danych (np. Science Citation Index albo National Citation Report) należy traktować inaczej. I tak , wyniki dotyczące całych instytucji czy centrów naukowych są tylko w przybliżeniu wiarygodne, natomiast wyniki dotyczące poszczególnych badaczy są bardzo mało wiarygodne i należy do nich podchodzić z dużą ostrożnością. Próby klasyfikacji badaczy na podstawie liczby ich publikacji czy cytowań muszą być podejmowane tylko z najwyższą rozwagą, a bezrozumne posługiwanie są wskaźnikami typu impact factor powinno być całkowicie zarzucone.
Zainteresowanych szczegółami odsyłam do obszernego artykułu „instruktażowego” [3].
2. Rankingi liczby publikacji
Przedstawię teraz dane dotyczące Polski. Na rycinie 2 przedstawiona jest liczba prac, które mają polskich autorów lub współautorów, rejestrowana każdego roku w bazie NSI. Liczba ta systematycznie rośnie (na wykresie widoczne jest także załamanie wywołane wprowadzeniem stanu wojennego). Trochę inaczej przedstawia się procentowy udział Polski w liczbie publikacji naukowych.
Ryc. 2. Liczba publikacji z autorami lub współautorami z Polski,
dodawanych każdego roku do bazy National Science Indicators
Ryc. 3. Procentowy wkład Polski do światowej bazy publikacji
Jak widać na rycinie 3, w latach 1980-1993 udział ten powoli spadał (wtedy liczba prac z Polski rosła wolniej od średniej światowej), ale spadek ten został zahamowany i od 1997 roku obserwujemy systematyczny wzrost. Wkład Polski do nauki światowej, mierzony liczbą publikacji naukowych, wynosi obecnie już prawie 1,17% (patrz tabela1).
Wydaje się, że jest to efekt wysiłków podejmowanych w KBN w celu przekonania polskich naukowców, aby publikowali swe prace w czasopismach wyróżnionych listą filadelfijską.
Tabela 1. Ranking według liczby publikacji w 2003r.
|
|
Ryc. 4. Procent prac z polskimi autorami (uwaga: wskutek zasady integer counting
w bazie NSI suma wkładów poszczególnych państw przekracza 100%).
Natomiast na rycinie 4 został przedstawiony procentowy udział prac z polskimi autorami. Ze względu na wyjaśnioną wyżej zasadę tworzenia bazy, przedstawione tu liczby są wyraźnie większe od tych z ryciny 3. Tu także jest wyraźna tendencja wzrostowa. Obecnie już około 1,4% publikacji naukowych ma autorów lub współautorów z Polski.
Rankingi bibliometryczne wzbudzają co pewien czas spore emocje, kiedy z okazji publikacji ich wyników w poczytnych periodykach, jak np. „Nature” [4], interesuje się tym zagadnieniem nawet prasa codzienna.
Wzrost naszego udziału w liczbie publikacji jest pocieszający, ale mniej optymistyczne wnioski płyną z porównania z innymi państwami.
Ryc. 5. Porównanie wkładu publikacji z Polski, Korei i Turcji
Na rycinie 5 widać, że tempo wzrostu Korei jest znacznie większe (Korea wyprzedziła Polskę w rankingu w 1997r.), a dużo szybciej rośnie też udział Turcji. Jest ona obecnie za nami, ale przypuszczalnie już za rok, dwa wyprzedzi Polskę. Podobne dane są przedstawione na rycinie 6. Chiny, które na początku lat 80. XX w. były daleko za Polską, rozwijają się niezmiernie szybko i obecnie są już w nauce potęgą światową.
W tabeli 1 podane są wkłady pierwszych 25 państw, które łącznie dają ponad 90% światowej „produkcji” publikacji.
W 1981r. Polska zajmowała wysokie, 15. miejsce w rankingu światowym pod względem liczby publikacji. Niestety, systematyczne niedofinansowanie nauki w Polsce spowodowało, że przez 20 lat systematycznie staczaliśmy się na coraz niższe miejsce (patrz ryc. 7).
W 1999r. Spadliśmy aż na 21. miejsce. Na szczęście od tego czasu odrabiamy straty i przesunęliśmy się już na miejsce 19. Niestety, chyba przyjdzie nam znów spaść o jedno miejsce, bo – jak przedstawiono wyżej- nauka w Turcji rozwija się znacznie szybciej niż w Polsce i nas wyprzedzi.
Ryc. 6. Porównanie szybkości wzrostu liczby z Polski, Brazylii i Chin
Ryc. 7. Miejsce zajmowane przez Polskę w rankingu krajów
pod względem liczby publikacji w bazie NSI.
Poszczególne dyscypliny naukowe rozwijają się w Polsce niejednakowo i zajmują różne miejsca w rankingach światowych. Najbliżej czołówki światowej są od dawna nauki ścisłe: astronomia, chemia, fizyka i matematyka oraz materiałoznawstwo (do którego znaczny wkład daje fizyka i chemia). Te dziedziny utrzymują się na początku drugiej dziesiątki, tuż za światowymi mocarstwami. W 1981 r. w czołówce światowej były także nauki inżynierskie (12. miejsce), ale od tego czasu obserwuje się systematyczny regres tej dziedziny. Podobnie niestety wygląda pozycja naszej informatyki.
Dużo gorzej wypadają w tym rankingu nauki biologiczne i medyczne, które zajmują miejsce w trzeciej dziesiątce państw. Pozycje poszczególnych dziedzin nauki w rankingu liczby publikacji pokazują tabela 2 oraz ryciny 8-10.
Tabela 2. Miejsca poszczególnych dziedzin polskich nauk ścisłych i technicznych
według liczby publikacji w rankingu światowym
(podział na dziedziny i ich nazwy pochodzą od twórców bazy NSI)
Dziedzina | 2003 | 1998-2002 | 1993-1997 | 1981 |
Fizyka | 12 | 12 | 13 | 11 |
Matematyka | 12 | 13 | 13 | 14 |
Chemia | 13 | 12 | 12 | 10 |
Materiałoznawstwo | 14 | 16 | 18 | 11 |
Nauki o roślinach i zwierzętach | 14 | 17 | 23 | 17 |
Astrofizyka | 15 | 16 | 16 | 25 |
Ekologia i środowisko | 20 | 24 | 27 | 20 |
Biologia i biochemia | 20 | 21 | 19 | 18 |
Farmakologia | 22 | 22-23 | 21 | 18-19 |
Nauki inżynierskie | 23 | 23 | 18 | 12 |
Biologia molekularna i genetyka | 23 | 23 | 23 | 20 |
Informatyka | 23 | 27 | 27 | 13 |
Immunologia | 23 | 25 | 24 | 20 |
Neurologia | 23-24 | 23 | 19 | 16-17 |
Nauki rolnicze | 25 | 28 | 29 | 26 |
Medycyna kliniczna | 26 | 30 | 32 | 23 |
Nauki o ziemi | 29 | 30 | 26 | 26 |
Mikrobiologia | 28 | 31-32 | 33 | 20 |
W naukach humanistycznych i społecznych najlepiej wypada od lat historia, najgorzej zaś edukacja (tabela 3). Spadek tej ostatniej dziedziny w rankingu światowym jest wręcz kompromitujący, gdyż okazuje się , że w ciągu minionych 5 lat wszyscy jej przedstawiciele w Polce zdołali opublikować tylko 3 (słownie: trzy) publikacje w znaczących periodykach światowych. Obecnie polska edukacja sąsiaduje w tym rankingu ze słabo rozwiniętymi krajami trzeciego świata.
Ryc. 8. Miejsca zajmowane przez chemię oraz nauki techniczne
Ryc. 9. Miejsca zajmowane przez fizykę oraz biologię molekularną z genetyką
Ryc. 10. Miejsca zajmowane przez matematykę i informatykę
Tabela 3. Miejsca poszczególnych polskich nauk humanistycznych
i społecznych w rankingu światowym
Dziedzina | 1998-2002 | 1993-1997 | 1981 |
Historia | 16 | 15 | 12-13 |
Studia klasyczne | 17 | 18 | 19-26 |
Architektura i sztuka | 19 | 18 | 28-33 |
Archeologia | 19 | 22 | 11-12 |
Językoznawstwo | 22 | 21 | 15-17 |
Sztuki wykonawcze | 25 | 31 | 10 |
Filozofia | 26 | 22 | 34-36 |
Religia i teologia | 26 | 24 | 22-26 |
Prawo | 28-31 | 25 | 16-19 |
Humanistyka (ogólne) | 30 | 36 | 16-17 |
Literaturoznawstwo | 31 | 28 | 32-36 |
Nauki społeczne | 34 | 34 | 24-25 |
Ekonomia i zarządzanie | 35 | 30 | 34-37 |
Psychologia i psychiatria | 35 | 33 | 21 |
Edukacja | 61-68 | 37 | 18-23 |
3. Rankingi cytowań
Wypada tu przypomnieć, że średnie liczby cytowań jednej publikacji w różnych dziedzinach są bardzo zróżnicowane (tabela 4), dlatego też jedyne sensowne porównywanie dziedzin to właśnie odniesienie do średniej światowej w poszczególnych dziedzinach.
Tabela 4. Średnia liczba cytowań jednej publikacji w różnych dziedzinach, znormalizowana do średniej liczby cytowań z architektury i sztuki, przyjętej za jednostkę.
(Nazwy dziedzin pochodzą z NSI)
-
Nazwa dziedziny w NSI Cytowalność Architektura i sztuka 1 Literaturoznawstwo 1,6 Sztuki wykonawcze 2,6 Religia i teologia 3,4 Studia klasyczne 3,5 Historia 4,3 Filozofia 4,4 Językoznawstwo 5,7 Humanistyka - ogólne 6,7 Archeologia 11,2 Edukacja 12,4 Informatyka 16,8 Nauki inżynierskie 16,7 Nauki społeczne 18,2 Matematyka 18,9 Materiałoznawstwo 20,2 Prawo 21,3 Nauki Rolnicze 21,4 Badania multidyscyplinarne 23,3 Ekonomia i zarządzanie 25,3 Nauka o roślinach i zwierzętach 28,6 Ekologia/środowisko 34,2 Fizyka 34,8 Chemia 35,5 Nauka o ziemi 39,4 Psychologia i psychiatria 41,1 Farmakologia 44,3 Medycyna kliniczna; w tym: 45,1 ortopedia 17,8 onkologia 74,2 Astrofizyka 61,2 Mikrobiologia 64,1 Biologia i biochemia 75,2 Neurologia 78,8 Immunologia 96,4 Biologia i genetyka 115,7 (w tym biologia komórki) 136,7
Dane dotyczące różnic cytowań w różnych dziedzinach nauki musi znać każdy, kto chciałby wyciągać jakieś wnioski bibliometryczne dla tych dziedzin. Porównanie bezwzględnej liczby cytowań bez uwzględniania poprawek byłoby mylące. Nie można przecież tego czynić, skoro, na przykład, średnia liczba cytowań jednej pracy z biologii komórki jest ponad 135 razy większa niż dla pracy z architektury i sztuki.
Jeśli chodzi o cytowalność polskich publikacji, to sytuacja jest pocieszająca. O ile na początku lat 80. średnia liczba cytowań polskich publikacji niewiele przekraczała 40% średniej światowej, to obecnie jest to już około 70% tej średniej i wskaźnik ten systematycznie rośnie (ryc. 11).
Ryc. 11. Średnia liczba cytowań polskich publikacji w procentach średniej światowej
Ryc. 12. Średnia liczba cytowań polskich publikacji z poszczególnych dziedzin
(w procentach średniej światowej dla danej dziedziny). Dane dotyczą lat 1999-2003
Jeśli chodzi o cytowalność w poszczególnych dziedzinach (ryc. 12), to najlepiej znów wypadają nauki ścisłe, astrofizyka (93% średniej światowej) i fizyka (91%). Tu nieco gorzej wypada matematyka (75%) i chemia (65%), natomiast bardzo dobrze – nauki inżynieryjne (90%) średniej światowej) i medycyna kliniczna (84%). Pozostałe nauki biomedyczne zajmują miejsca na końcu takiej klasyfikacji: w najwyżej stojącej neurologii jest to tylko 52%, a w najgorszej, mikrobiologii – tylko 38% średniej światowej.
Słaba pozycja naszych dyscyplin biomedycznych w rankingu cytowań jest powodem tego, że Polska wypada dość słabo w ogólnej klasyfikacji pod względem przeciętnej liczb cytowań jednej pracy (bez podziału na dziedziny). Wyjaśniłem te sprawy dokładnie w artykule [3]. Struktura naszej nauki jest taka, że większość publikacji w bazie NSI jest z dziedzin ścisłych, których cytowalność (patrz tabela 4) jest wyraźnie niższa niż dziedzin biomedycznych. W krajach najbardziej rozwiniętych naukowo większość publikacji pochodzi właśnie z wysoko cytowanych dziedzin biomedycznych. W rezultacie nauki biomedyczne dają tylko 30% wkładu do cytowalności publikacji z Polski, podczas gdy np. dla USA jest to aż 66%. Wniosek z tego jest prosty: nasza pozycja w rankingu publikacji i cytowań ulegnie znaczącej poprawie tylko wtedy, jeśli znacznie zintensyfikujemy w Polsce badania w dziedzinach biomedycznych. Zresztą kwestie bibliometryczne nie są jedynym argumentem, że tak należy postąpić, ponieważ powszechnie się uważa, że właśnie w naukach biometrycznych trzeba upatrywać znaczących odkryć i dźwigni postępu.
Ryc. 13. Liczba publikacji z poszczególnych krajów członkowskich OECD w funkcji nakładów
na badania w dolarach PPP (parytetu siły nabywczej). Dane dotyczą 2002r.
4. Koszty a wyniki
Jeśli uwzględnimy fakt, że od piętnastu lat nauka w Polsce jest systematycznie niedofinansowana, to wyniki naszych badaczy wypadają zupełnie nieźle. Przedstawiam tu dane na podstawie opracowań statystycznych OECD, gdyż tylko dla krajów członkowskich tej organizacji nakłady na badania (za 2002r.) zostały przedstawione w jednolitej formie [5]. Zestawienie tych danych z informacjami z bazy NSI pozwala ocenić efektywność badań w różnych krajach.
Na rycinie 13 przedstawiona jest liczba publikacji w funkcji nakładów na badania. Jak widać, wynik Polski jest wyraźnie lepszy od tego, którego można by oczekiwać z ogólnego trendu danych. Inaczej mówiąc, nasz publikacje kosztują mniej niż w większości innych krajów OECD, co jeszcze wyraźniej widać na rycinie 14.
Ryc. 14. Przeciętny koszt jednej publikacji z krajów członkowskich OECD
w dolarach PPP (parytetu siły nabywczej). Dane dotyczą roku 2002
Ryciny 15 i 16 przedstawiają korelacje liczby publikacji i zatrudnionych badaczy oraz związku cytowań z kosztami publikacji.
Ryc. 15. Zależność liczby publikacji na jednego badacza od przypadających na niego nakładów
w dolarach PPP (parytetu siły nabywczej). Dane dotyczą krajów OECD w 2002r. Poszczególne kraje zostały oznaczone symbolami takimi jak ich tablice rejestracyjne samochodów
Ryc. 16. Zależność średniej liczby cytowań od kosztów publikacji dla krajów członkowskich OECD. Dane dotyczą roku 2002
Podsumowanie
Z przedstawionych danych wynika, że pod względem wskaźników bibliometrycznych najwyżej w rankingu światowym plasuje się obecnie (2003r.) polska fizyka (12. miejsce w liczbie publikacji, cytowania na poziomie 91% średniej światowej). Za nią są matematyka (12. miejsce w liczbie publikacji i cytowania na poziomie 75% średniej światowej) i chemia (13. miejsce w liczbie publikacji i cytowania na poziomie 65% średniej światowej). Nauka o materiałach zajmuje miejsce 14. w liczbie publikacji, ale ma cytowalność tylko 54% średniej światowej. Astrofizyka ma największą ze wszystkich cytowalność (93% średniej światowej), ale zajmuje dopiero 15. miejsce w liczbie publikacji. Z dziedzin humanistyczno- społecznych plasująca się najwyżej historia (14. miejsce w liczbie publikacji) ma bardzo niską cytowalność, zaledwie 20% średniej krajowej.
Bibliografia
[1] K. Stępień, Astronomia z astrofizyką w Polsce u progu XXI wieku, Nauka 4/2004, s. 105.
[2] A.K. Wróblewski, Efektywność współpracy międzynarodowej w nauce, Nauka 2000, nr 2, s. 71-77.
[3] A.K. Wróblewski, Bibliometryczna trylogia, „Zagadnienia Naukoznawstwa” 2002, nr 1-2, s. 7-29.
[4] D.A. King, The scientific impact of nations, „Nature” 2004, t. 430, s. 311.
[5] OECD in Figures, OECD Paris, July 2004.
The position of Polich science and its different disciplines in bibliometric rankings (publications and citations) is presented on the basis of the National Science Indicators (NSI) database covering the years 1981-2003.
Key words: Polish scuence, bibliometric rankings, National Science Indicators.
O autorze
Prof. dr hab. Andrzej Kajetan Wróblewski, członek rzeczywisty PAN, Wydział Fizyki Uniwersytetu Warszawskiego, e-mail: