c# - chart - Que signifie "Data Massage"?



chart asp net (3)

Je suis en train de lire, et je suis tombé sur l'idée d'éviter un internalStore si mon application n'a pas besoin de masser les données avant d'être envoyée à SQL. Qu'est-ce qu'un massage de données?

https://src-bin.com


Answer #1

Et enfin, il y a la pratique moins savoureuse de masser les données en jetant des données (ou en ajustant les chiffres) lorsqu'elles ne vous donnent pas la réponse que vous voulez. Unfortunatley peole faire l'analyse statistique souvent masser les données pour se débarrasser de ces aberrations embêtantes qui réfutent leur théorie. Parce que cette pratique se référant au nettoyage des données en tant que masse des données est inappropriée. Nettoyage des données pour en faire quelque chose qui peut aller dans votre système (se débarrasser des dates sans signification comme 30/02/2009 car quelqu'un d'autre les stockait dans varchar au lieu de dates, séparant les noms et prénoms dans des champs séparés, corrigeant toutes les données majuscules , en ajoutant des valeurs par défaut pour les champs qui nécessitent des données lorsque les données fournies ne sont pas fournies, etc.) est une chose - masser les données implique une pratique d'ajustement inapproprié des données.


Answer #2

Manipuler, traiter, modifier, recalculer. En bref, si vous déplacez simplement les données en raw, alors inutile d'utiliser internalStore, mais si vous faites quelque chose avant le stockage, alors vous pouvez vouloir un internalStore.

-Adam


Answer #3

Parfois, tout le processus de déplacement des données est appelé "ETL", ce qui signifie "Extraire, Transformer, Charger". Masser les données est l'étape de «transformation», mais cela implique des corrections ad-hoc que vous devez faire pour lisser les problèmes que vous avez rencontrés (comme un massage pour vos muscles) plutôt que des transformations entre des formats bien connus.

Pense que vous pourriez faire pour "masser" les données:

  • Changez les formats de ce que le système source émet à ce que le système cible attend, par exemple changer le format de la date de d / m / y à m / d / y.
  • remplacer les valeurs manquantes par des valeurs par défaut, par exemple, fournir "0" lorsqu'une quantité n'est pas donnée.
  • Filtrer les enregistrements qui ne sont pas nécessaires dans le système cible.
  • Vérifiez la validité des enregistrements et ignorez ou signalez les lignes qui provoqueraient une erreur si vous essayiez de les insérer.
  • Normaliser les données pour supprimer les variations qui devraient être les mêmes, par exemple, remplacer les majuscules par des minuscules, remplacer "01" par "1".




database-design