survey <- survey_raw %>%
+mutate(
+# G1Q06_SQ001 = ehrenamtlich engagiert fix missings
+G1Q06_SQ001 =case_when(is.na(G1Q06_SQ001) & G1Q04 =="Keine"~"Ja",
+TRUE~as.character(G1Q06_SQ001)
+ ),
+# G1Q06_SQ002 = hauptamtlich engagiert fix missings
+G1Q06_SQ002 =case_when(is.na(G1Q06_SQ002) & G1Q04 =="Keine"~"Nicht gewählt",
+TRUE~as.character(G1Q06_SQ002)
+ ),
+G1Q06_SQ001 =as_factor(G1Q06_SQ001),
+G1Q06_SQ002 =as_factor(G1Q06_SQ002),
+# generate one variable that combines the multiple choice information about the role of the respondent
+role_respondent =case_when(
+# decision: Teilnehmende die beide Rollen angegeben haben werden zu hauptamtlich gezählt (es sind nur 6 und eine binary Variable ist besser geeignet für Gruppenvergleiche)
+ G1Q06_SQ001 =="Ja"& G1Q06_SQ002 =="Ja"~"ehrenamtlich",
+ G1Q06_SQ001 =="Ja"~"ehrenamtlich",
+ G1Q06_SQ002 =="Ja"~"hauptamlich",
+# decision: Teilnehmende die keine der Kategorien angegeben haben werden zu NA anstatt eine vierte Kategorie "keine" einzuführen, da das wahrcheinlich nicht von Interesse ist.
+ G1Q06_SQ001 =="Nicht gewählt"& G1Q06_SQ002 =="Nicht gewählt"~NA_character_,
+is.na(G1Q06_SQ001) &is.na(G1Q06_SQ002) ~NA_character_,
+TRUE~"error")
+ )
+
+
+
+
G1Q06_SQ001 filter
+
Wir sind daran interessiert zu wissen, ob die Teilnehmenden selbst ehrenamtlich, hauptamtlich oder in beiden Positionen arbeiten. Diese Information findet sich in der Frage G1Q06: “Welche Rolle(n) haben sie in der Organisation. Die Filterführung des Fragebogens hat allerdings dazu geführt, dass Personen die angegeben haben, dass in ihrer Organisation keine hauptamtlichen Mitarbeiten vorhanden, sind die G1Q06 Frage nicht bekommen haben, da schon klar ist, dass sie dann ehrenamtlich sind. Dadurch haben sie momentan Missings auf den Variablen die zur G1Q06 Frage gehören. Die logische Verbindung zwischen G1Q04 und G1Q06 wollen wir also im Nachhinein recoden.
Gibt es signifikante Zusammenhänge zwischen - G1Q04 Anzahl Hauptamtlicher - G1Q05 Anzahl Ehrenamtlicher - G5Q04 Bereich (Sport/ Bidung etc) Und allen anderen Fragen.
G4Q02 Keine < 5 5-10 11-50
+ nutzen wir in unserer Organisation aktuell 40.5% 21.4% 11.9% 11.9%
+ haben wir mal genutzt oder ausprobiert 25.0% 18.8% 18.8% 31.2%
+ nutzen wir nicht in unserer Organisation 15.8% 28.9% 21.1% 18.4%
+ ich weiß nicht ob wir sie nutzen oder genutzt haben 6.2% 18.8% 6.2% 37.5%
+ ich kenne den Begriff nicht 0.0% 33.3% 33.3% 33.3%
+ Total 24.3% 23.5% 15.7% 20.9%
+ > 50
+ 14.3%
+ 6.2%
+ 15.8%
+ 31.2%
+ 0.0%
+ 15.7%
+
+
+
Erklärungsansaetze für Ergebnisse: - Sampling Bias in der Umfrage -
G4Q02 Keine < 5 5 - 10
+ nutzen wir in unserer Organisation aktuell 33.3% 45.5% 37.0%
+ haben wir mal genutzt oder ausprobiert 0.0% 0.0% 11.1%
+ nutzen wir nicht in unserer Organisation 50.0% 36.4% 44.4%
+ ich weiß nicht ob wir sie nutzen oder genutzt haben 16.7% 18.2% 7.4%
+ ich kenne den Begriff nicht 0.0% 0.0% 0.0%
+ Total 100.0% 100.0% 100.0%
+ 11 - 50 > 50
+ 40.7% 30.2%
+ 22.2% 16.3%
+ 25.9% 27.9%
+ 7.4% 20.9%
+ 3.7% 4.7%
+ 100.0% 100.0%
+
+
+
Chi-Square Test, um zu sehen, ob zw. den zwei kategorialen Variablen ein signifikanter Zusammenhang besteht:
+
+
+Show the code
+
chisq.test(survey$G4Q02, survey$G1Q05)
+
+
+
Warning in stats::chisq.test(x, y, ...): Chi-squared approximation may be
+incorrect
+
+
+
+ Pearson's Chi-squared test
+
+data: survey$G4Q02 and survey$G1Q05
+X-squared = 12.462, df = 16, p-value = 0.7116
+
+
+
Werden Cluster sichtbar?
+
+
Für welche Organisationen ist SKA interessant? Hypothesen:
+
Große Organisationen mit vielen Hauptamtlichen und eigenen IT Abteilungen haben kein Interessen an Open Source Lösungen sondern entscheiden sich für bekannte, teure propritäre Tools
+
Organisationen mit eigenen IT Abteilungen haben Wissen und Kompetenz selbst Open Source Lösungen aufzusetzen (also Zugang) und nutzen sie somit häufiger.
+
+
G2Q02 Wer kümmert sich um eure digitale Infrastruktur G1Q04 Wie viele hauptamtlich Mitarbeitende hat deine Organisation? In Korrelation zu Bisherige Erfahrung mit Open Source (G4Q02) oder der Wichtigkeit bestimmter Eigenschaften des Tools (G03Q03 und G03Q03b)
+
+
+
+
+
+
+
+
+
+
+
\ No newline at end of file
diff --git a/00-exploration.qmd b/00-exploration.qmd
new file mode 100644
index 0000000..668750e
--- /dev/null
+++ b/00-exploration.qmd
@@ -0,0 +1,237 @@
+---
+title: "Local-IT Bedarfsanalyse"
+format:
+ html:
+ code-fold: true
+ code-summary: "Show the code"
+---
+# Analyse
+
+Datenbereinigung
+```{r import data, message=FALSE}
+# Datenbereinigung
+library(tidyverse)
+library(janitor)
+survey_raw <- readr::read_rds(here::here("data", "processed", "survey_with_labels.rds"))
+```
+
+```{r wrangle data}
+survey <- survey_raw %>%
+ mutate(
+ # G1Q06_SQ001 = ehrenamtlich engagiert fix missings
+ G1Q06_SQ001 = case_when(is.na(G1Q06_SQ001) & G1Q04 == "Keine" ~ "Ja",
+ TRUE ~ as.character(G1Q06_SQ001)
+ ),
+ # G1Q06_SQ002 = hauptamtlich engagiert fix missings
+ G1Q06_SQ002 = case_when(is.na(G1Q06_SQ002) & G1Q04 == "Keine" ~ "Nicht gewählt",
+ TRUE ~ as.character(G1Q06_SQ002)
+ ),
+ G1Q06_SQ001 = as_factor(G1Q06_SQ001),
+ G1Q06_SQ002 = as_factor(G1Q06_SQ002),
+ # generate one variable that combines the multiple choice information about the role of the respondent
+ role_respondent = case_when(
+ # decision: Teilnehmende die beide Rollen angegeben haben werden zu hauptamtlich gezählt (es sind nur 6 und eine binary Variable ist besser geeignet für Gruppenvergleiche)
+ G1Q06_SQ001 == "Ja" & G1Q06_SQ002 == "Ja" ~ "ehrenamtlich",
+ G1Q06_SQ001 == "Ja" ~ "ehrenamtlich",
+ G1Q06_SQ002 == "Ja" ~ "hauptamlich",
+ # decision: Teilnehmende die keine der Kategorien angegeben haben werden zu NA anstatt eine vierte Kategorie "keine" einzuführen, da das wahrcheinlich nicht von Interesse ist.
+ G1Q06_SQ001 == "Nicht gewählt" & G1Q06_SQ002 == "Nicht gewählt" ~ NA_character_,
+ is.na(G1Q06_SQ001) & is.na(G1Q06_SQ002) ~ NA_character_,
+ TRUE ~ "error")
+ )
+```
+
+
+## G1Q06_SQ001 filter
+
+Wir sind daran interessiert zu wissen, ob die Teilnehmenden selbst ehrenamtlich, hauptamtlich oder in beiden Positionen arbeiten. Diese Information findet sich in der Frage `G1Q06`: "Welche Rolle(n) haben sie in der Organisation. Die Filterführung des Fragebogens hat allerdings dazu geführt, dass Personen die angegeben haben, dass in ihrer Organisation keine hauptamtlichen Mitarbeiten vorhanden, sind die `G1Q06` Frage nicht bekommen haben, da schon klar ist, dass sie dann ehrenamtlich sind. Dadurch haben sie momentan Missings auf den Variablen die zur `G1Q06` Frage gehören. Die logische Verbindung zwischen `G1Q04` und `G1Q06` wollen wir also im Nachhinein recoden.
+
+```{r explore G1Q06_SQ001 filter, inlcude = FALSE}
+survey_raw %>% tabyl(G1Q04, G1Q06_SQ001)
+#TODO wurde der Filter auch für G1Q05 gesetzt? Sieht nicht so aus ()
+survey_raw %>% tabyl(G1Q05, G1Q06_SQ002)
+```
+
+36 Personen haben angegeben, dass sich keine Hauptamtlichen in der Org. befinden -> die wollen wir recodieren
+
+```{r}
+survey %>% tabyl(G1Q06_SQ001, G1Q06_SQ002)
+```
+
+```{r}
+testthat::expect_equal(survey %>% filter(role_respondent == "error") %>% nrow(), 0)
+```
+
+
+# Stichprobe
+```{r}
+# TODO: Analyse der Missings (wie weit sind Fragebögen ausgefuellt? schmeißen wir sie alle weg?)
+```
+
+## Rolle der befragten Personen
+```{r}
+survey %>% count(role_respondent)
+```
+
+
+## Anzahl Hauptamtlicher und Ehrenamtlicher
+```{r}
+# facet wrap plot: beide Fragen haben die gleiche Skala
+tmp_long <- survey %>%
+ select(id, G1Q05, G1Q04) %>%
+ pivot_longer(-id, names_to = "var", values_to = "value")
+
+tmp_long %>%
+ ggplot(aes(x = value)) +
+ geom_bar()+
+ facet_wrap(~var)+
+ labs(caption = "G1Q04 Anzahl Hauptamtlicher\nG1Q05 Anzahl Ehrenamtlicher",
+ title = "Anzahl Hauptamtlicher (G1Q04) \n und Anzahl Ehrenamtlicher (G1Q05)")+
+ coord_flip()
+```
+
+
+```{r}
+create_dot_plot <- function(data, x_var, y_var) {
+ tmp <- data %>%
+ count({{ x_var }}, {{ y_var }}) %>%
+ drop_na({{ x_var }}, {{ y_var }})
+
+ x_var_pos <- which(attributes(survey)$names == enexpr(x_var))
+ x_var_lab <- attributes(survey)$variable.labels[x_var_pos] %>%
+ str_replace(pattern = "\\?.+$", replacement = "?")
+
+ y_var_pos <- which(attributes(survey)$names == enexpr(y_var))
+ y_var_lab <- attributes(survey)$variable.labels[y_var_pos] %>%
+ str_replace(pattern = "\\?.+$", replacement = "?")
+
+ # plot
+ ggplot(tmp) +
+ aes(x = {{ x_var }},
+ y = {{ y_var }},
+ size = n,
+ label = n) +
+ geom_point() +
+ labs(caption = glue::glue("{enexpr(x_var)}: {x_var_lab} \n {enexpr(y_var)}: {y_var_lab}")) +
+ scale_fill_viridis_c() +
+ theme_minimal()
+}
+
+create_dot_plot(survey, G1Q04, G1Q05)
+
+
+```
+
+
+
+# Hypothesen
+
+1. Grundsätzlich
+
+Gibt es signifikante Zusammenhänge zwischen
+- G1Q04 Anzahl Hauptamtlicher
+- G1Q05 Anzahl Ehrenamtlicher
+- G5Q04 Bereich (Sport/ Bidung etc)
+Und allen anderen Fragen.
+
+
+```{r}
+tmp <- survey_raw %>%
+ count(G1Q05, G1Q04) %>%
+ drop_na(G1Q05, G1Q04)
+
+ggplot(tmp) +
+ aes(x = G1Q05, y = G1Q04, fill = n) +
+ geom_tile(size = 1.2) +
+labs(y = "Anzahl Hauptamtlicher", x = "Anzahl Ehrenamtlicher") +
+ scale_fill_viridis_c()+
+ theme_minimal()
+```
+
+```{r}
+ggplot(tmp) +
+ aes(x = G1Q05, y = G1Q04, size = n) +
+ geom_point() +
+labs(y = "Anzahl Hauptamtlicher", x = "Anzahl Ehrenamtlicher") +
+ scale_fill_viridis_c()+
+ theme_minimal()
+
+
+p <- survey_raw %>%
+ count(G4Q02, G1Q04) %>%
+ drop_na() %>%
+ ggplot() +
+ aes(x = G4Q02, y = G1Q04, size = n) +
+ geom_point() +
+ labs(y = "Anzahl Hauptamtlicher", x = "Nutzung") +
+ coord_flip()+
+ theme_light()
+p
+```
+
+
+```{r}
+survey_raw %>%
+ select(G4Q02, G1Q04) %>%
+ drop_na() %>%
+ janitor::tabyl(G4Q02, G1Q04) %>%
+ janitor::adorn_totals() %>%
+ janitor::adorn_percentages() %>%
+ janitor::adorn_pct_formatting()
+```
+
+
+Erklärungsansaetze für Ergebnisse:
+- Sampling Bias in der Umfrage
+-
+
+## Anzahl ehrenamtliche
+```{r}
+
+survey_raw %>%
+ count(G4Q02) %>%
+ drop_na() %>%
+ ggplot(aes(x = G4Q02, y = n))+
+ geom_col()+
+ coord_flip()
+
+
+survey_raw %>%
+ count(G4Q02, G1Q05) %>%
+ drop_na() %>%
+ ggplot() +
+ aes(x = G4Q02, y = G1Q05, size = n) +
+ geom_point() +
+ labs(y = "Anzahl Ehrenamtlicher", x = "Nutzung") +
+ coord_flip()+
+ theme_minimal()
+
+
+survey_raw %>%
+ select(G4Q02, G1Q05) %>%
+ drop_na() %>%
+ janitor::tabyl(G4Q02, G1Q05) %>%
+ janitor::adorn_totals() %>%
+ janitor::adorn_percentages(denominator = "col") %>%
+ janitor::adorn_pct_formatting()
+```
+
+Chi-Square Test, um zu sehen, ob zw. den zwei kategorialen Variablen ein signifikanter Zusammenhang besteht:
+
+```{r}
+chisq.test(survey$G4Q02, survey$G1Q05)
+```
+
+Werden Cluster sichtbar?
+
+
+
+2. Für welche Organisationen ist SKA interessant?
+Hypothesen:
+1. Große Organisationen mit vielen Hauptamtlichen und eigenen IT Abteilungen haben kein Interessen an Open Source Lösungen sondern entscheiden sich für bekannte, teure propritäre Tools
+2. Organisationen mit eigenen IT Abteilungen haben Wissen und Kompetenz selbst Open Source Lösungen aufzusetzen (also Zugang) und nutzen sie somit häufiger.
+
+G2Q02 Wer kümmert sich um eure digitale Infrastruktur
+G1Q04 Wie viele hauptamtlich Mitarbeitende hat deine Organisation?
+In Korrelation zu
+Bisherige Erfahrung mit Open Source (G4Q02) oder der Wichtigkeit bestimmter Eigenschaften des Tools (G03Q03 und G03Q03b)
diff --git a/01-quarto-interactive.html b/01-quarto-interactive.html
new file mode 100644
index 0000000..0a13431
--- /dev/null
+++ b/01-quarto-interactive.html
@@ -0,0 +1,343 @@
+
+
+
+
+
+
+
+
+
+Untitled
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
Untitled
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
R: Import Data
+
+
library(tidyverse)
+# install.packages("here)
+
+
+
data <- readr::read_rds(here::here("data", "processed", "survey_with_labels.rds"))
Vielen Dank für deine Teilnahme an unserer Umfrage zu Digitaler Zusammenarbeit im Ehrenamts- und Engagement Sektor. Die Studie wird durchgeführt von dem Verein Local-IT e.V. und gefördert von der Deutschen Stiftung für Ehrenamt und Engagement.
Nach zwei Jahren Covid-bedingter, erzwungener Erkundung der digitalen Möglichkeiten der Zusammenarbeit, wollen wir resümieren: Was konnten Vereine oder ehrenamtlich Engagierte mitnehmen aus dieser Zeit? Welche digitale Tools werden auch weiter genutzt? Was klappt gut, was könnte besser oder anders gelöst werden?
Die Umfrage wird ca. 10 bis 15 Minuten dauern.
Datenschutzhinweise:
Wir, Local-IT e.V., sind die für die Durchführung dieser Studie verantwortliche Stelle. Wir werden die Informationen, die du uns zur Verfügung stellst, nur zu Forschungszwecken verwenden.
Deine Teilnahme ist freiwillig und du kannst die Teilnahme jederzeit beenden.Diese Daten werden anonym erfasst.Die Ergebnisse der Studie werden, wenn überhaupt, nur in zusammengefasster Form an Dritte übermittelt.Wir raten dir davon ab, personenbezogene Daten (wie Name, E-Mail-Adresse oder Telefonnummer) im Kommentarfeld zu hinterlassen.
Hiermit möchten wir dich zu einer Umfrage einladen.
Der Titel der Umfrage ist '{SURVEYNAME}'
'{SURVEYDESCRIPTION}'
Um an dieser Umfrage teilzunehmen, klicke bitte auf den unten stehenden Link.
Mit freundlichen Grüßen,
{ADMINNAME} ({ADMINEMAIL})
---------------------------------------------- Klicke hier um die Umfrage zu starten: {SURVEYURL}
Wenn Du an dieser Umfrage nicht teilnehmen und keine weiteren Erinnerungen erhalten möchtest, klicke bitte auf den folgenden Link: {OPTOUTURL}
Wenn Du geblockt bist, jedoch wieder teilnehmen und weitere Einladungen erhalten möchtest, klicken bitte auf den folgenden Link: {OPTINURL}" de-informal
- SL surveyls_email_remind_subj "Erinnerung an die Teilnahme an einer Umfrage" de-informal
- SL surveyls_email_remind "Hallo {FIRSTNAME},
Vor kurzem haben wir Dich zu einer Umfrage eingeladen.
Zu unserem Bedauern haben wir bemerkt, dass Du die Umfrage noch nicht ausgefüllt hast. Wir möchten Dir mitteilen, dass die Umfrage noch aktiv ist und würden uns freuen, wenn Du teilnehmen könntest.
Der Titel der Umfrage ist '{SURVEYNAME}'
'{SURVEYDESCRIPTION}'
Um an dieser Umfrage teilzunehmen, klicke bitte auf den unten stehenden Link.
Mit freundlichen Grüßen,
{ADMINNAME} ({ADMINEMAIL})
---------------------------------------------- Klicken Du hier um die Umfrage zu starten: {SURVEYURL}
Wenn Du an dieser Umfrage nicht teilnehmen und keine weiteren Erinnerungen erhalten möchtest, klicke bitte auf den folgenden Link: {OPTOUTURL}" de-informal
- SL surveyls_email_register_subj "Registrierungsbestätigung für Teilnahmeumfrage" de-informal
- SL surveyls_email_register "Hallo {FIRSTNAME},
Du (oder jemand, der Deine E-Mail benutzt hat) hat sich für eine Umfrage mit dem Titel {SURVEYNAME} angemeldet.
Um an dieser Umfrage teilzunehmen, klicke bitte auf den folgenden Link.nn{SURVEYURL}
Wenn Du irgendwelche Fragen zu dieser Umfrage hast oder wenn Du Dich _nicht_ für diese Umfrage angemeldet hast und Du glaubst, dass Dir diese E-Mail irrtümlicherweise zugeschickt worden ist, kontaktiere bitte {ADMINNAME} unter {ADMINEMAIL}." de-informal
- SL surveyls_email_confirm_subj "Bestätigung für die Teilnahme an unserer Umfrage" de-informal
- SL surveyls_email_confirm "Hallo {FIRSTNAME},
Vielen Dank für die Teilnahme an der Umfrage mit dem Titel {SURVEYNAME}. Deine Antworten wurden bei uns gespeichert.
Wenn du irgendwelche Fragen zu dieser E-Mail hast, kontaktiere bitte {ADMINNAME} unter {ADMINEMAIL}.
Eine neue Antwort wurde für die Umfrage '{SURVEYNAME}' abgegeben.
Klicke auf den folgenden Link um den Antwortdatensatz anzusehen: {VIEWRESPONSEURL}
Klicke auf den folgenden Link um den Antwortdatensatz zu bearbeiten: {EDITRESPONSEURL}
Um die Statistik zu sehen, klicke hier: {STATISTICSURL}" de-informal
- SL email_admin_responses_subj "Antwortabsendung für Umfrage {SURVEYNAME} mit Ergebnissen" de-informal
- SL email_admin_responses "Hallo,
Eine neue Antwort wurde für die Umfrage '{SURVEYNAME}' abgegeben.
Klicke auf den folgenden Link um den Antwortdatensatz anzusehen: {VIEWRESPONSEURL}
Klicke auf den folgenden Link um den Antwortdatensatz zu bearbeiten: {EDITRESPONSEURL}
Um die Statistik zu sehen, klicke hier: {STATISTICSURL}
Die folgenden Antworten wurden vom Teilnehmer gegeben: {ANSWERTABLE}" de-informal
- SL surveyls_numberformat 1 de-informal
-1 G 1 "Meine Organisation" 1 "Zunächst ein paar Fragen um deine Organisation, in der es in dieser Studie gehen soll besser einordnen zu können:" de-informal
+G 1 "Meine Organisation" 1 "Zunächst ein paar Fragen um deine Organisation, in der es in dieser Studie gehen soll besser einordnen zu können:" de-informal
45 Q L G1Q01 1 "Hat deine Organisation eine anerkannte Gemeinnützigkeit?" de-informal N N N 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0
45 A 0 AO01 Ja de-informal 0
45 A 0 AO02 "Ich glaube schon" de-informal 0
diff --git a/survey_227824_R_data_file-2022-08-13.csv b/data/raw/survey_227824_R_data_file-2022-08-13.csv
similarity index 100%
rename from survey_227824_R_data_file-2022-08-13.csv
rename to data/raw/survey_227824_R_data_file-2022-08-13.csv
diff --git a/survey_227824_R_syntax_file-2022-08-13.R b/data/raw/survey_227824_R_syntax_file-2022-08-13.R
similarity index 99%
rename from survey_227824_R_syntax_file-2022-08-13.R
rename to data/raw/survey_227824_R_syntax_file-2022-08-13.R
index 16e7b4f..f69f9c3 100644
--- a/survey_227824_R_syntax_file-2022-08-13.R
+++ b/data/raw/survey_227824_R_syntax_file-2022-08-13.R
@@ -1,4 +1,4 @@
-data <- read.csv("survey_227824_R_data_file.csv", quote = "'\"", na.strings=c("", "\"\""), stringsAsFactors=FALSE, fileEncoding="UTF-8-BOM")
+data <- read.csv(here::here("data", "raw", "survey_227824_R_data_file-2022-08-13.csv"), quote = "'\"", na.strings=c("", "\"\""), stringsAsFactors=FALSE, fileEncoding="UTF-8-BOM")
# LimeSurvey Field type: F
@@ -1020,3 +1020,5 @@ data[, 209] <- as.numeric(data[, 209])
attributes(data)$variable.labels[209] <- "[Teil einer größeren Organisation/ Dachverband] Meine Organisation ist..."
data[, 209] <- factor(data[, 209], levels=c(1,0),labels=c("Ja", "Nicht gewählt"))
names(data)[209] <- "G5Q05_SQ004"
+
+readr::write_rds(data, here::here("data", "processed", "survey_with_labels.rds"))