Śmierć arkuszom kalkulacyjnym. Podczas gdy toczy się debata na temat… | by Keith McNulty | Oct, 2023

Podczas gdy w środowisku akademickim toczy się debata na temat kryzysu związanego z odtwarzalnością, pod naszymi nosami znajduje się znacznie bardziej powszechny kryzys

Był czas, kiedy jedynym sposobem, w jaki wiedziałem, jak przeprowadzić analizę, było użycie arkusza kalkulacyjnego. Spędziłem ponad 15 lat budując wysoce złożone modele i analizy na tych ekranach z prostokątnymi polami, na których tak wielu polegało.

Potem, na początku 2016 roku, wszystko się dla mnie zmieniło. Zaczęło się zamieszanie wokół R i Pythona, a ja zapytałem kilka osób “wtajemniczonych”, które oprogramowanie uważają za najlepsze do przeprowadzania najszerszego zakresu analiz. Jednogłośna odpowiedź, jaką otrzymałem, wskazywała na R (prawdopodobnie ze względu na ludzi, z którymi rozmawiałem). Postanowiłem więc, że nauczę się tej rzeczy i dowiem się, czy cały ten szum jest tego wart.

Sześć miesięcy później, po wielu nieprzespanych nocach i weekendach, a także dzięki znalezieniu wszelkich szans na rozwiązanie problemów związanych z pracą przy użyciu R, znalazłem się w sytuacji, w której nie mogłem znieść myśli o ponownej pracy w arkuszu kalkulacyjnym. Mówię poważnie. Dziś otwieranie ich jest obowiązkiem, a jedynym powodem, dla którego to robię, jest to, że komunikuję się z ludźmi, którzy są w takiej samej sytuacji jak ja 7 lat temu.

Patrzę na funkcje takie jak VLOOKUP i porównuję je z dplyr::left_join(). To tak, jakbym stał na ulicy zaśmieconej śmieciami, a po jednej stronie był nieszczęśnik, który ma małą śmieciarkę i zbiera kawałki jeden po drugim, a po drugiej ktoś niosący największy, najpotężniejszy odkurzacz do śmieci, jaki kiedykolwiek widziałeś.

Uważam więc, że arkusze kalkulacyjne nie są dla nas dobre. Wciągają nas w pułapkę wąskiego zestawu widoków i opcji, zużywają całą pamięć komputera na swój ładny wygląd i styl, decydują się dąsać i uciekać do drugiego pokoju, gdy jest za dużo danych, a wszystko dlatego, że (podobnie jak nasze dzieci ze Snapchatem) uzależniliśmy się od natychmiastowej wizualno-analitycznej gratyfikacji.

Jest jeszcze jeden powód, dla którego arkusze kalkulacyjne przez lata wyrządzały szkody – doprowadziły one do korporacyjnego kryzysu odtwarzalności.

Czym jest kryzys odtwarzalności?

Ważną częścią metody naukowej jest wymóg odtwarzania wyników w celu ich walidacji. Większość naukowców zgadza się, że przynajmniej…