4 votes

Logiciel pour produire des graphiques pour des ensembles de données très volumineux ?

Je cherche à produire des graphiques à partir de certains ensembles de données très volumineux. Pour commencer, j'ai un ensemble de données avec 40 séries différentes, chacune comportant 5000 échantillons que je voudrais représenter sous la forme d'un graphique linéaire, chaque série étant représentée par une ligne dans le graphique.

Les chiffres s'arrêtent après environ 450 échantillons. Excel s'en sort un peu mieux et arrive à 1000 échantillons. Mais aucun des deux ne peut gérer l'ensemble complet des échantillons à travers toutes les séries.

Y a-t-il un meilleur logiciel que je peux utiliser pour générer le graphique? Est-ce que OmniGraphSketcher pourrait gérer cette taille d'ensemble de données? Et R? Ou gnuplot?

Quelque chose avec une courbe d'apprentissage plus facile est préférable (c'est-à-dire que j'évite gnuplot comme la peste jusqu'à ce qu'il soit clair que c'est mon seul espoir...) et ça ne me dérange pas si la génération du graphique ne peut pas être faite en temps réel. Je ne me dérange pas de mettre en place les choses et d'attendre ensuite qu'une image du graphique soit produite en arrière-plan. Et des points bonus s'il peut produire des sorties de graphiques aussi agréables à regarder que celles produites par Numbers pour des ensembles de données plus petits.

5voto

Jeff Points 952

Je suppose que vous voulez dire 5000 observations. R fonctionnera, et RStudio vous permettra d'utiliser R avec un peu plus d'interface graphique que l'application native. Des solutions commerciales comme Stata - qui a une courbe d'apprentissage douce, en comparaison surtout à R - fonctionneront également avec ce type d'échantillon sans difficulté (selon les normes statistiques, 5000 observations constituent un ensemble de données relativement petit).

La courbe d'apprentissage importera si vous voulez aller au-delà d'un simple graphique ; sinon, un rapide coup d'œil à la documentation pour les graphiques linéaires devrait suffire (pour R, consultez ici et ici, par exemple). J'espère que cela vous aidera !

0voto

msanford Points 469

R saura certainement gérer cette taille de données pour vous. Si vous gérez régulièrement des ensembles de données, je vous recommanderais certainement d'apprendre à l'utiliser.

Raccourci pour vous donner la suggestion OpenOffice.org (également connu sous le nom de OOo).

Cependant, je suis surpris qu'Excel plante. J'ai récemment utilisé Excel (sur Windows) pour gérer 8 séries de 27 000 échantillons sans problème, produisant des graphiques complexes en quelques secondes seulement.

À quel moment ces deux applications plantent-elles? Est-ce, par hasard, lors de l'importation de votre ensemble de données, ou bugent-elles lorsque vous tentez de les compiler dans un graphique? Je ne connais pas Numbers, mais Excel devrait pouvoir gérer des centaines de milliers de lignes sans problème.

LesApples.com

LesApples est une communauté de Apple où vous pouvez résoudre vos problèmes et vos doutes. Vous pouvez consulter les questions des autres utilisateurs d'appareils Apple, poser vos propres questions ou résoudre celles des autres.

Powered by:

X