Public Libraries Meet Big Data : Roles, Comprehension and Practical Applications
Zhan, Ming (2021-06-18)
Zhan, Ming
Åbo Akademi University
18.06.2021
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
Julkaisun pysyvä osoite on
https://urn.fi/URN:ISBN: 978-952-12-4070-6
https://urn.fi/URN:ISBN: 978-952-12-4070-6
Tiivistelmä
The world is witnessing the advent of Big Data. Meanwhile, the development of technology accelerates the spread of Big Data. As such, organizations have started to realize that Big Data can be important resource owing to its value transformation characteristic. Both private and public sectors have applied Big Data for resource saving, decision making, service improving etc. Public libraries as one of the necessary parts of public sectors should also commit themselves into exploiting the potential values of Big Data.
Furthermore, the wide application of social media not only brings about more possibilities for public libraries to extend their services, communicate with users, and present themselves, but also makes public libraries confront an exponential data explosion. Since Big Data can be transformed into useful information, public libraries, as hubs of information, are in a natural position to explore values via analyzing Big Data generated on social media, and manage information and knowledge generated from Big Data. Nonetheless, there are few studies focusing on helping public libraries to understand, manage and use Big Data. Therefore, the overall purpose of this study is to help public libraries realize what their responsibilities might be in the context of Big Data and to understand what Big Data is and how it can be applied.
In order to achieve the overall purpose, four research questions are asked. Each question is answered by one study included in this doctoral dissertation. Inductive approaches combining qualitative or quantitative methodologies are conducted to accomplish each study.
Q1: What kinds of roles should public libraries undertake in the context of Big Data? An online survey and eleven semi-structured interviews with library directors were carried out to identify roles of public libraries in the context of Big Data. Q2: What does Big Data mean specifically in librarianship? A content analysis was conducted to highlight key aspects of Big Data definitions used in library and information science literatures. The answers to these two questions jointly lay the theoretical foundation of Big Data for public libraries.
In order to present public libraries with concrete examples about how to apply Big Data, Instagram is chosen as the representative of social media to collect data owing to its rising popularity, its leading role in image-based social media and the lack of research in utilizing Instagram in public libraries. Hashtags are chosen as the starting point to design research projects, owing to their widespread usage on social media, in particular Instagram. Hashtags could signify the content of Instagram captions and boost communication between caption posters and other Instagram users. Therefore, two research questions are asked based on these two functions of hashtags. Q3: How should libraries effectively organize hashtags to attain more “likes” and comments for library-related posts on Instagram? Q4: What 6 topics do current readers like or dislike? Millions of library-related captions were collected and analysed to answer these two questions via regression models and supervised machine learning models.
In the end, this study outlines nine roles for public libraries to undertake in the context of Big Data. A Big Data definition specifically used in librarianship is also put forward. Two applications of Big Data for public libraries are organized. These three contents together fulfill the overall purpose. The accomplishment of this study fills research gaps in bringing Big Data to public libraries, enriches the content of Big Data applications and Instagram applications in public libraries, handles the uneven spread research in social media study regarding the single-platform prevalence, suggests a novel way to use hashtags: hashtag organization, and provides a creative way to know library users: sentiment analysis on hashtags. Moreover, this doctoral study is organized in Finland where public libraries are highly developed. Therefore, the result of this study could contribute to the development of public libraries in the context of Big Data in other countries.
----------
Världen bevittnar fördelarna med big data, allt medan den tekniska utvecklingen accelererar och producerar stora mängder data. Olika organisationer har börjat inse att big data är en viktig resurs som kan skapa mervärde. Både den privata och den offentliga sektorn har börjat använda sig av big data för att stöda beslutsfattande, utveckla tjänster osv. De allmänna biblioteken, som är en viktig del av den offentliga sektorn, bör också utreda hur de kan utnyttja det potentiella värdet som big data för med sig.
Den utbredda användningen av sociala medier medför inte bara flera möjligheter för allmänna bibliotek att utöka sina tjänster, kommunicera med användare och presentera sig själva, utan innebär också utmaningar med att hantera en exponentiell ökning av data. Eftersom big data kan omvandlas till användbar information, kunde de allmänna biblioteken vara i centrum för denna transformation. De innehar en naturlig position för att utforska användarmönster, t.ex. genom att analysera big data som genereras på sociala medier och därmed hantera information och kunskap som genereras från denna data. Ändå finns det få studier som fokuserar på att stöda de allmänna biblioteken att förstå, hantera och använda big data. Därför är det övergripande syftet med denna studie att bidra med insikter som kan hjälpa allmänna bibliotek med att förstå vad big data är, hur det kan tillämpas och således utveckla de allmänna bibliotekens ansvarsområden i samband med big data.
För att uppnå det övergripande syftet ställs fyra forskningsfrågor. Varje fråga besvaras av en studie som ingår i denna doktorsavhandling. Induktiva metoder som kombinerar kvalitativa eller kvantitativa metoder genomfördes för att genomföra studierna.
1) Vilka roller kan allmänna bibliotek ha i samband med big data? En online surveyundersökning och elva semistrukturerade intervjuer med biblioteksdirektörer genomfördes för att identifiera biblioteks olika roller i samband med big data. 2) Vad betyder big data specifikt i bibliotekskontext? En innehållsanalys av relevant litteratur genomfördes för att lyfta fram centrala big data-definitioner. Svaren på dessa två frågor utgör den teoretiska grunden för hur big data definieras och förstås inom allmänna bibliotek.
För att presentera konkreta exempel på hur man kunde använda big data inom allmänna bibliotek, valdes Instagram att representera sociala medier och som plattform för att samla in data. Valet har gjorts på grund av att Instagram hela tiden ökar i popularitet samt för dess ledande ställning bland bildbaserade sociala medier. Det finns också en brist på forskning om användandet av Instagram data inom allmänna bibliotek. Hashtags valdes som utgångspunkt för att designa studierna, de beskriver bildernas innehåll, de fungerar som verktyg för kommunikation mellan bilder och användare och användningen av hashtags är mycket utbredd på sociala medier, särskilt Instagram. Två forskningsfrågor ställdes, baserade på två olika hashtagsfunktioner. 3) Hur kan biblioteken effektivt organisera hashtags för att uppnå ökad interaktion med bibliotekrelaterade inlägg på Instagram i former av "gillanden" och kommentarer? 4) Vilka ämnen gillar eller ogillar användarna? Flera miljoner biblioteksrelaterade bildtexter samlades in och analyserades för att svara på dessa två frågor via regressionsmodeller och maskininlärningsmodeller.
Resultaten från studierna bidrog till att definiera nio olika roller som allmänna bibliotek kan ta för att bättre använda big data i sin verksamhet och en definition av big data, som specifikt kan används i bibliotekskontext, presenteras. Två applikationer av big data för allmänna bibliotek utvecklades för denna studie. Dessa resultat uppfyller tillsammans det övergripande syftet och denna studie bidrar således konkret till forskningen om de möjligheter och det mervärde som big data kan föra med sig till
allmänna bibliotek. Avhandlingen bidrar även till utvecklandet av big data och Instagram-applikationer i allmänna bibliotek och presenterar nya sätt att använda hashtags, att på ett kreativt sätt bättre lära känna sina biblioteksanvändare, dvs. sentimentanalys av hashtags. Denna studie utfördes i Finland som har ett välfungerande bibliotekssystem. Resultaten av denna studie kan förhoppningsvis bidra till utvecklandet av big data vid allmänna bibliotek även i andra länder.
Furthermore, the wide application of social media not only brings about more possibilities for public libraries to extend their services, communicate with users, and present themselves, but also makes public libraries confront an exponential data explosion. Since Big Data can be transformed into useful information, public libraries, as hubs of information, are in a natural position to explore values via analyzing Big Data generated on social media, and manage information and knowledge generated from Big Data. Nonetheless, there are few studies focusing on helping public libraries to understand, manage and use Big Data. Therefore, the overall purpose of this study is to help public libraries realize what their responsibilities might be in the context of Big Data and to understand what Big Data is and how it can be applied.
In order to achieve the overall purpose, four research questions are asked. Each question is answered by one study included in this doctoral dissertation. Inductive approaches combining qualitative or quantitative methodologies are conducted to accomplish each study.
Q1: What kinds of roles should public libraries undertake in the context of Big Data? An online survey and eleven semi-structured interviews with library directors were carried out to identify roles of public libraries in the context of Big Data. Q2: What does Big Data mean specifically in librarianship? A content analysis was conducted to highlight key aspects of Big Data definitions used in library and information science literatures. The answers to these two questions jointly lay the theoretical foundation of Big Data for public libraries.
In order to present public libraries with concrete examples about how to apply Big Data, Instagram is chosen as the representative of social media to collect data owing to its rising popularity, its leading role in image-based social media and the lack of research in utilizing Instagram in public libraries. Hashtags are chosen as the starting point to design research projects, owing to their widespread usage on social media, in particular Instagram. Hashtags could signify the content of Instagram captions and boost communication between caption posters and other Instagram users. Therefore, two research questions are asked based on these two functions of hashtags. Q3: How should libraries effectively organize hashtags to attain more “likes” and comments for library-related posts on Instagram? Q4: What 6 topics do current readers like or dislike? Millions of library-related captions were collected and analysed to answer these two questions via regression models and supervised machine learning models.
In the end, this study outlines nine roles for public libraries to undertake in the context of Big Data. A Big Data definition specifically used in librarianship is also put forward. Two applications of Big Data for public libraries are organized. These three contents together fulfill the overall purpose. The accomplishment of this study fills research gaps in bringing Big Data to public libraries, enriches the content of Big Data applications and Instagram applications in public libraries, handles the uneven spread research in social media study regarding the single-platform prevalence, suggests a novel way to use hashtags: hashtag organization, and provides a creative way to know library users: sentiment analysis on hashtags. Moreover, this doctoral study is organized in Finland where public libraries are highly developed. Therefore, the result of this study could contribute to the development of public libraries in the context of Big Data in other countries.
----------
Världen bevittnar fördelarna med big data, allt medan den tekniska utvecklingen accelererar och producerar stora mängder data. Olika organisationer har börjat inse att big data är en viktig resurs som kan skapa mervärde. Både den privata och den offentliga sektorn har börjat använda sig av big data för att stöda beslutsfattande, utveckla tjänster osv. De allmänna biblioteken, som är en viktig del av den offentliga sektorn, bör också utreda hur de kan utnyttja det potentiella värdet som big data för med sig.
Den utbredda användningen av sociala medier medför inte bara flera möjligheter för allmänna bibliotek att utöka sina tjänster, kommunicera med användare och presentera sig själva, utan innebär också utmaningar med att hantera en exponentiell ökning av data. Eftersom big data kan omvandlas till användbar information, kunde de allmänna biblioteken vara i centrum för denna transformation. De innehar en naturlig position för att utforska användarmönster, t.ex. genom att analysera big data som genereras på sociala medier och därmed hantera information och kunskap som genereras från denna data. Ändå finns det få studier som fokuserar på att stöda de allmänna biblioteken att förstå, hantera och använda big data. Därför är det övergripande syftet med denna studie att bidra med insikter som kan hjälpa allmänna bibliotek med att förstå vad big data är, hur det kan tillämpas och således utveckla de allmänna bibliotekens ansvarsområden i samband med big data.
För att uppnå det övergripande syftet ställs fyra forskningsfrågor. Varje fråga besvaras av en studie som ingår i denna doktorsavhandling. Induktiva metoder som kombinerar kvalitativa eller kvantitativa metoder genomfördes för att genomföra studierna.
1) Vilka roller kan allmänna bibliotek ha i samband med big data? En online surveyundersökning och elva semistrukturerade intervjuer med biblioteksdirektörer genomfördes för att identifiera biblioteks olika roller i samband med big data. 2) Vad betyder big data specifikt i bibliotekskontext? En innehållsanalys av relevant litteratur genomfördes för att lyfta fram centrala big data-definitioner. Svaren på dessa två frågor utgör den teoretiska grunden för hur big data definieras och förstås inom allmänna bibliotek.
För att presentera konkreta exempel på hur man kunde använda big data inom allmänna bibliotek, valdes Instagram att representera sociala medier och som plattform för att samla in data. Valet har gjorts på grund av att Instagram hela tiden ökar i popularitet samt för dess ledande ställning bland bildbaserade sociala medier. Det finns också en brist på forskning om användandet av Instagram data inom allmänna bibliotek. Hashtags valdes som utgångspunkt för att designa studierna, de beskriver bildernas innehåll, de fungerar som verktyg för kommunikation mellan bilder och användare och användningen av hashtags är mycket utbredd på sociala medier, särskilt Instagram. Två forskningsfrågor ställdes, baserade på två olika hashtagsfunktioner. 3) Hur kan biblioteken effektivt organisera hashtags för att uppnå ökad interaktion med bibliotekrelaterade inlägg på Instagram i former av "gillanden" och kommentarer? 4) Vilka ämnen gillar eller ogillar användarna? Flera miljoner biblioteksrelaterade bildtexter samlades in och analyserades för att svara på dessa två frågor via regressionsmodeller och maskininlärningsmodeller.
Resultaten från studierna bidrog till att definiera nio olika roller som allmänna bibliotek kan ta för att bättre använda big data i sin verksamhet och en definition av big data, som specifikt kan används i bibliotekskontext, presenteras. Två applikationer av big data för allmänna bibliotek utvecklades för denna studie. Dessa resultat uppfyller tillsammans det övergripande syftet och denna studie bidrar således konkret till forskningen om de möjligheter och det mervärde som big data kan föra med sig till
allmänna bibliotek. Avhandlingen bidrar även till utvecklandet av big data och Instagram-applikationer i allmänna bibliotek och presenterar nya sätt att använda hashtags, att på ett kreativt sätt bättre lära känna sina biblioteksanvändare, dvs. sentimentanalys av hashtags. Denna studie utfördes i Finland som har ett välfungerande bibliotekssystem. Resultaten av denna studie kan förhoppningsvis bidra till utvecklandet av big data vid allmänna bibliotek även i andra länder.