| ||
auteur : Aurélien Regat-Barrel | ||
Le C++ standard possède son propre type chaîne de caractères : std::string.
Celui-ci est déclaré dans l'en-tête standard <string>.
string est le type chaîne de caractères standard du langage C++.
Il est donc judicieux de l'utiliser en priorité sur les char * qui sont hérités du langage C.
Pour plus de détails à ce sujet, vous pouvez lire Quels sont les avantages de std::string par rapport à char * ?.
|
| ||
auteur : Aurélien Regat-Barrel | ||
Au delà du simple conteneur de caractères, string est aussi et avant tout l'interface chaîne de caractères de la bibliothèque standard. Autrement dit en utilisant string vous bénéficiez des très nombreuses autres fonctionnalités de la bibliothèque standard, ce qui est plus délicat avec les char*.
Par exemple, il est possible de lire une ligne d'un fichier sans avoir à se préoccuper de sa taille. Un travail important de gestion et de vérification est fait en toute transparence, ce qui rend le code plus maintenable. string est donc beaucoup plus simple et sûre d'utilisation que les nombreuses fonctions utilisant les char*. |
| ||
auteur : Aurélien Regat-Barrel | ||
Programmer en utilisant std::string est incontestablement plus rapide, plus lisible et plus sûr que de programmer en utilisant les antiques char*.
Si votre but est d'écrire un programme qui marche et qui soit facile à maintenir, utiliser string est un bien meilleur choix.
Il est en effet tentant de dire qu'utiliser les char* fait surtout planter le programme plus vite.
Il faut aussi relativiser la possible lenteur de string par le fait que l'écart est très souvent sans conséquence pour l'utilisateur. Même si lire et afficher une chaîne de caractères est deux fois plus lent avec les string qu'avec les char*, l'écart est dans ce cas dérisoire voire non mesurable. Néanmoins, il est des cas où une application manipule un très grand nombre de chaînes de caractères, et on peut alors, à juste titre, se poser la question. La réponse n'est pas évidente. Tout d'abord, le premier point en faveur des string est que celles-ci connaissent en permanence leur longueur (fonction size() ou length()), qui n'a donc pas besoin d'être calculée, contrairement aux char* ou il faut systématiquement effectuer un appel à strlen(). Ainsi, plus la longueur des chaînes manipulées est importante, et plus string se révèlera performante vis à vis des char*. Un autre point important concerne la manière dont sont gérées les char*. Beaucoup de programmeurs ne veulent pas s'embêter et définissent généralement une taille commune à toutes leurs chaînes de caractères.
Là aussi, string est meilleur car non seulement le problème (inévitable) de la fois où cette taille limite sera atteinte ne se pose pas, mais aussi parce que ce code C provoque une perte plus ou moins importante de mémoire (typiquement, MAX_SIZE vaut 100 voire 1000, c'est à dire que même si une chaîne ne comporte que 10 caractères, elle occupera 100 ou 1000 octets en mémoire!).
La comparaison doit donc être faite avec une gestion dynamique de char*, chose laborieuse à gérer en C et faite de manière transparente et sûre par string. Enfin, il est difficile de généraliser sur les string dans la mesure où celles-ci sont spécifiques à un compilateur (et même souvent une version de compilateur) et ce qui est vrai pour une implémentation ne l'est pas forcément pour une autre (d'autant plus que la capacité d'optimisation du compilateur entre aussi en jeu). Ainsi, par exemple, la classe string de Visual C++ 6 implémente le Copy On Write (pas de copie réelle de contenu entre 2 string, mais un partage via un comptage de références) qui permet d'effectuer des affectations très rapides entre string. La version 7 de ce compilateur n'implémente plus cette fonctionnalité mais intègre un petit buffer de 16 octets destiné à contenir directement les chaînes de petite taille. Cela permet de se passer d'allocation dynamique et donc d'augmenter les performances qui sont du coup égales à celles d'un tableau de char (dans le cas de petites chaînes). La comparaison de performances entre string et char* est donc difficile, et elle ne peut être qu'au cas par cas. Bien souvent, l'écart de performance entre les deux est de l'ordre de quelques pour cent. Vous l'aurez compris, la performance est loin d'être le seul critère, aussi faites confiance aux nombreux développeurs de talent qui ont développé le C++ et utilisez le type chaînes de caractères qui lui est propre : string. |
| ||
auteur : Luc Hermitte | ||
const char * et char const * ont la même signification : un pointeur sur un caractère constant.
La règle est que le const s'applique toujours sur ce qui le précède. S'il n'y a rien avant, alors on inverse sa position avec ce qui est juste après. Utiliser const signifie qu'il ne faut pas modifier le(s) caractère(s) référencé(s) par le pointeur. Donc, typiquement, une fonction qui prend un char* déclare qu'elle modifiera le contenu du buffer pointé par le pointeur (accès en écriture). Une fonction qui prend un const char* déclare qu'elle va lire le contenu du buffer sans le modifier (accès en lecture seule). |
| ||
auteur : Aurélien Regat-Barrel | ||
<string> et <string.h> sont deux fichiers d'en-tête totalement différents. Le premier est l'en-tête standard C++ qui définit le type std::string.
Le second est un en-tête hérité du langage C qui définit diverses fonctions C de manipulation de chaînes de caractères.
Il est à noter qu'inclure <string.h> est obsolète, il convient d'inclure <cstring> à la place. A ce sujet lire aussi Quelle est le différence entre #include <iostream.h> et #include <iostream> ?. |
| ||
auteur : Aurélien Regat-Barrel | ||
Aucune! Ces deux fonctions renvoient toutes les deux la longueur de la chaîne. En fait, length() retourne size(), mais on est libre d'utiliser l'une ou l'autre. Voir aussi Quelle différence entre string::size() et string::capacity() ? |
| ||
auteur : Aurélien Regat-Barrel | ||
size renvoie le nombre de caractères contenus dans la chaîne (par exemple 4 pour "abcd") et capacity la capacité de stockage de la chaîne, c'est à dire le nombre total de caractères qu'elle peut stocker sans nécessiter une réallocation. capacity est donc toujours au moins égal à size, et peut être plus élevé, en particulier si vous faites un appel à reserve.
La valeur retournée par capacity peut varier d'un compilateur à l'autre, ou plutôt d'une implémentation de la STL à l'autre.
C'est pourquoi il est fort probable que vous n'obteniez pas les mêmes résultats si votre compilateur n'est pas celui utilisé pour ce test (Visual C++ .Net 2003).
Par contre quelque soit votre compilateur les valeurs retournées par size devraient être les même. Voir aussi Quelle est la différence entre string::length() et string::size() ? |
| ||
auteurs : JEG, LFE, Aurélien Regat-Barrel | ||
En utilisant tout simplement le constructeur ou l'opérateur d'affectation de la classe string :
|
| ||
auteurs : LFE, Aurélien Regat-Barrel | ||
Même en C++ on est parfois obligé d'utiliser des char *. Pour obtenir une chaîne de caractères C non modifiable (const char *), il suffit d'appeler la fonction c_str() de string.
La chaîne renvoyée est qualifiée comme non modifiable via le mot-clé const. Il ne faut pas chercher à la modifier. A ce sujet, lire les questions Quelle est la différence entre char*, const char* et char const * ? et Quelles précautions faut-il prendre avec string::c_str() et string::data() ?. Pour obtenir une chaîne de type C modifiable, il faut créer une copie de la string.
|
| ||
auteur : Aurélien Regat-Barrel | ||
L'utilisation d'un objet ostringstream permet de convertir un entier en une string :
Pour une solution générique à ce problème, consultez Comment convertir n'importe quel objet en string ?.
Pour éviter les erreurs, lire aussi [Piège] Comment initialiser/affecter un nombre à une string ? .
|
| ||
auteur : Aurélien Regat-Barrel | ||
En utilisant istringstream:
Vous pouvez consulter Comment convertir une string en un objet de n'importe quel type ? pour une utilisation plus générique de cette solution.
| ||
lien : Comment déterminer si une chaîne contient une valeur d'un certain type ? |
| ||
auteur : Aurélien Regat-Barrel | ||
L'utilisation de ostringstream permet de convertir en une string n'importe quel objet pour lequel l'opérateur ostream::operator <<() a été défini. Il est donc possible de créer une fonction générique de conversion de n'importe quel objet en une string grâce à l'utilisation des templates :
|
| ||
auteur : Aurélien Regat-Barrel | ||
L'utilisation de istringstream permet de convertir une string en n'importe quel type pour lequel l'opérateur istream::operator >>() a été défini. Il est donc possible de créer une fonction générique de conversion d'une string en un autre type grâce à l'utilisation des templates :
Pour la conversion d'une string en une chaîne de caractères constante (const char *), utilisez la fonction membre c_str() de std::string. Pour la conversion d'une string en une chaîne de caractères modifiable, consultez Comment convertir une string en char* ? ? Pour des détails sur le principe de la conversion avec l'opérateur >>, consultez Comment fonctionne le test de réussite de conversion if ( str >> num ) ? | ||
lien : Comment déterminer si une chaîne contient une valeur d'un certain type ? |
| ||
auteurs : LFE, Aurélien Regat-Barrel | ||
Il suffit de tester le résultat de l'opération de conversion, comme le fait la fonction générique from_string de la question Comment convertir une string en un objet de n'importe quel type ?.
Ce principe est expliqué dans Comment fonctionne le test de réussite de conversion if ( str >> num ) ?
Après avoir converti avec succès Str en un float, on tente d'extraire une chaîne, opération qui ne peut échouer que s'il ne reste plus rien une fois le float extrait.
Cela permet de faire échouer le troisième test avec "10.0abcd". Cette solution spécifique aux float peut aisément être généralisée grâce aux templates :
L'utilisation des templates nécessite ici leur instanciation explicite, c'est à dire de spécifier au moment de l'utilisation de la fonction le type dont on souhaite vérifier la conversion depuis une string.
Comme le montre cet exemple, la réussite ou non de la conversion est déterminée par le comportement de l'opérateur >> pour le type donné. La fonction is_of_type devrait donc plutôt s'appeler is_convertible_in_type.
Pour tester avec plus de rigueur le contenu d'une string il faut donc se tourner vers une autre solution, comme l'utilisation d'expressions régulières.
| ||
lien : Comment convertir une string en un objet de n'importe quel type ? |
| |||
auteur : Aurélien Regat-Barrel | |||
Pour que le code suivant compile :
Le compilateur cherche à convertir l'expression s >> n en un booléen.
Il commence par rechercher un opérateur applicable et trouve celui hérité de istream qui accepte un int. Cela revient donc à avoir le code suivant :
Cet opérateur retourne une référence sur le flux utilisé, c'est à dire ici la variable s.
Le compilateur essaye alors de convertir cette référence (qui correspond à s après l'appel de l'opérateur >>, donc après avoir tenté la conversion en int) en booléen. istream ne définit pas d'opérateur de conversion vers bool, mais une conversion implicite est possible grâce à l'opérateur operator void*().
Ce dernier retourne un pointeur nul si les indicateurs d'échec du flux sont positionnés, ce qui est le cas en cas d'échec de conversion.
L'ensemble du processus effectué par le compilateur correspond donc aux appels explicites suivants :
|
| ||
auteur : Aurélien Regat-Barrel | ||
c_str() retourne un pointeur sur une chaîne de caractères constante terminée par le caractère nul (chaîne de caractères C).
data() retourne aussi un pointeur sur une chaîne de caractères constante, mais la présence du caractère terminal nul n'est pas exigée donc non garantie.
Donc c_str() renvoie un pointeur constant sur un buffer contenant size() + 1 caractères et data() sur un buffer de size() caractères.
|
| ||
auteur : Aurélien Regat-Barrel | ||
Il ne faut faire aucune hypothèse quant à la façon dont est implémentée la classe string. Le comportement de cette dernière est spécifique à presque chaque version de compilateur C++ existant. Par exemple, les caractères peuvent ne pas être stockés en interne de manière contiguë (on peut envisager un système de concaténation rapide via un chaînage de sous chaînes de caractères). Ou encore, certaines implémentations utilisent le Copy On Write (COW) qui implique que plusieurs objets string peuvent en interne partager le même espace mémoire pour stocker leurs caractères. Le seul point commun à toutes ces implémentations est que l'on est assuré que le pointeur retourné par c_str() ou data() désigne une chaîne de caractères contigus. Mais rien n'empêche celui-ci de pointer vers une copie créée pour l'occasion ! C'est pourquoi il est très important de ne jamais modifier la chaîne retournée par ces fonctions. Un autre point important est que ce pointeur peut être invalidé suite à une modification, et que sa durée de vie n'excède pas celle de l'objet associé. Le code suivant illustre ces deux points :
Le code ci-dessus compile parfaitement, mais provoque un certain nombre d'erreurs d'exécution qui varie en fonction de l'implémentation de string utilisée.
|
| ||
auteur : Aurélien Regat-Barrel | ||
string (mais aussi <algorithm>) possède deux fonctions de recherche qui toutes les deux recherchent la première occurrence d'un élément :
La différence entre les deux est que find recherche la première occurrence d'un caractère ou d'une chaîne de caractères dans une string tandis que find_first_of recherche le premier caractère de la chaîne qui soit égal à l'un de ceux donnés en paramètre.
Donc dans le cas de la recherche d'un caractère il n'y a pas de différence entre les deux, mais ces deux fonctions sont très différentes si leur argument est une chaîne de caractères.
find considèrera cette chaîne comme une sous chaîne à rechercher, et find_first_of comme une liste de caractères à rechercher.
L'appel à find retourne la position de la sous chaîne "ba" dans "abcba" (3° position).
L'appel à find_first_of renvoie la position de la première occurrence de n'importe lequel des caractères passés en paramètre, c'est à dire ici 0 (première lettre de "abcba" = a qui figure bien dans la liste "ba").
|
| ||
auteur : Aurélien Regat-Barrel | ||
De la même manière que les chaînes ANSI, mais au moyen du type std::wstring qui est défini dans le fichier d'en-tête standard <string>.
Il s'agit d'une spécialisation de std::basic_string pour le type wchar_t (caractère Unicode) au même titre que std::string l'est pour le type char.
Notez qu'une version Unicode existe aussi pour les flux, afin de les rendre utilisables avec wstring et wchar_t. Ainsi, on utilisera wcout pour l'affichage, wcin pour la saisie, wifstream pour la lecture de fichiers, ... Cependant, en ce qui concerne les fichiers, les caractères wchar_t sont convertis de manière transparente en char au moment de l'écriture. Le C++ standard ne permet pas en effet de manipuler des fichiers Unicode.
Pour réaliser les conversions string <-> wstring, voir Comment effectuer les conversions de texte ASCII <-> Unicode ?.
|
| ||||
auteur : Laurent Gomila | ||||
Le type standard pour manipuler des chaînes en C++ est std::string. Mais si l'on regarde de plus près, on s'aperçoit qu'il ne s'agit
en fait que qu'un typedef :
Le premier paramètre représente le
type des caractères manipulés, le troisième est l'allocateur et nous importe peu ici. Ce qui est intéressant, c'est le second paramètre qui
définit les opérations de base (recherches, comparaisons, ...) sur le type manipulé. Ainsi, pour créer des chaînes de caractères ne tenant
pas compte de la casse (différence entre majuscules et minuscules) il suffit de créer un char_traits perso :
Il ne nous reste plus ensuite qu'à créer le basic_string correspondant :
L'avantage est que celui-ci se manipule exactement comme un std::string normal :
Pour des informations plus complètes, vous pouvez jeter un oeil à l'item n°29
des GOTW (Guru Of The Week).
|
| ||
auteurs : Aurélien Regat-Barrel, Laurent Gomila | ||
D'une manière générale, le problème de la conversion d'une chaîne majuscule en minuscule (ou inversement)
est bien plus complexe qu'il n'y paraît.
C'est un sujet qui débordre du cadre de cette FAQ, mais voici un rapide aperçu des problèmes soulevés:
Si l'on se recentre sur le C++, la solution classique (qui est aussi celle généralement attendue) est
d'effectuer une conversion in-place ("en place", c'est à dire directement sur la chaîne, caractère par
caractère) au moyen de toupper (pour mettre en majuscule) ou tolower (pour mettre en minuscule).
std::transform est traditionnellement utilisé pour appliquer une des ces fonctions à chaque caractère d'une chaîne.
Pour convertir une string en minuscules ou en majuscules, il faut appliquer la fonction std::tolower / std::toupper
à chaque caractère, ce que l'on réaliser par exemple grâce à std::transform. Cependant, std::tolower et std::toupper attendent un paramètre compris dans l'intervalle [0...UCHAR_MAX] (ou EOF), et un char peut potentiellement être négatif (les caractères accentués, par exemple). Utiliser directement ces fonctions provoquerait donc un comportement indéfini par la norme, c'est pourquoi il faut ajouter un traitement intermédiaire, afin de convertir les caractères dans le bon type (unsigned char ici).
Si vous n'êtes pas familier avec l'écriture utilisée pour my_tolower et my_toupper, voir Qu'est-ce qu'un foncteur ?.
Ceux qui recherchent des explications poussées et une solution complètement fonctionnelle pour la conversion minuscules /
majuscules, peuvent consulter
cette
discussion sur fr.comp.lang.c++.
|
| ||
auteur : Laurent Gomila | ||
Le plus simple est d'utiliser la fonction std::reverse() sur la chaîne existante, ou d'en créer une nouvelle en passant un itérateur inverse au constructeur de std::string.
|
| ||
auteur : Aurélien Regat-Barrel | ||
std::string ne dispose pas de fonction équivalente à la fonction C standard strtok(). Il existe de nombreuses façons de réaliser un équivalent à cette fonction. L'une des solutions les plus simples et de procéder au découpage sur un istringstream au moyen de std::getline():
Par défaut getline() sert à extraire des chaînes délimitées par un saut de ligne, mais comme le montre l'exemple précédent il est possible de spécifier un autre séparateur (ici le caractère ';'). Attention : getline() va considérer tout ce qui se trouve entre deux ';' comme étant une ligne à extraire. Cela veut dire que la phrase "mot1 mot2;;mot3" (notez le double point virgule entre mot2 et mot3) sera découpée en "mot1 mot2", "" (chaîne vide) et "mot3". Cette utilisation de getline() ne permet aussi de spécifier qu'un seul séparateur. Si vos mots sont séparés par de simples espaces, vous pouvez aussi vous inspirer de [Exemple] Comment manipuler un tableau de string ?.
Pour quelque chose de plus évolué, vous pouvez vous tourner vers boost::tokenizer (voir Comment découper une chaîne avec boost::tokenizer ?) ou encore réaliser
votre propre fonction de découpage en vous inspirant de ceci : Breaking a C++ string into tokens.
|
| ||
auteur : Aurélien Regat-Barrel | ||
<string> effectue en général une allocation dynamique afin de stocker la chaîne de caractères. Cette allocation peut échouer si la mémoire fait défaut. Il faut donc être prudent avec l'utilisation de string et plus généralement des conteneurs de la STL lors de la gestion d'une exception bad_alloc.
C'est pour cela que la classe de base des exceptions std::exception n'utilise pas string pour sa fonction membre what qui renvoie un message décrivant l'exception.
Il ne faut donc pas chercher à le faire lorsque l'on crée sa propre classe exception.
|
| ||
auteur : Aurélien Regat-Barrel | ||
On ne peut pas. Le code suivant ne compile pas :
Il est possible d'arriver au résultat escompté en chaînant une série de if testant les différentes chaînes, mais une solution élégante en C++ consiste à utiliser std::map défini dans l'en-tête standard <map>. Une map permet d'associer un élément à une clé. Dans notre cas nous allons associer une fonction de traitement à une chaîne de caractères :
|
| ||
auteur : superspag | ||
Les fonctions suivantes permettent, via l'utilisation de la bibliothèque standard, de transformer un texte Unicode en
ASCII (narrow), et vice-versa (widen).
|
| ||
auteur : Aurélien Regat-Barrel | ||
Le code suivant compile mais ne donne pas le résultat attendu :
Ce code ne produit pas la chaîne "0".
Il compile car le zéro est interprété comme un pointeur NULL. Certains compilateurs permissifs acceptent même un nombre différent de zéro, ce qui peut avoir des conséquences désastreuses (accès aléatoire à une zone mémoire). Il n'est pas possible d'initialiser directement une string avec un nombre. Il faut convertir celui-ci en chaîne de caractères puis utiliser ce résultat. La question Comment convertir un nombre en une string ? explique comment réaliser cela. |
| ||
auteur : Laurent Gomila | ||
Notez que le premier exemple (SupprimeTousLesCaracteres) est un cas typique d'utilisation de l'idiome erase-remove qui consiste à combiner la fonction remove() avec la fonction erase() afin de supprimer les éléments répondant à un certain critère (ici au fait d'être égal au caractère donné).
|
| ||
auteur : Aurélien Regat-Barrel | ||
Le code suivant illustre des opérations courantes effectuées sur un nom de fichier :
|
| ||
auteur : Aurélien Regat-Barrel | ||
| ||
lien : Comment utiliser les itérateurs de flux ? |
Les sources présentées sur cette page sont libres de droits et vous pouvez les utiliser à votre convenance. Par contre, la page de présentation constitue une œuvre intellectuelle protégée par les droits d'auteur. Copyright © 2008 Developpez LLC. Tous droits réservés Developpez LLC. Aucune reproduction, même partielle, ne peut être faite de ce site ni de l'ensemble de son contenu : textes, documents et images sans l'autorisation expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.