Planet
navi homePPSaboutscreenshotsdownloaddevelopmentforum

source: code/trunk/src/libraries/util/StringUtils.cc @ 6665

Last change on this file since 6665 was 6424, checked in by rgrieder, 15 years ago

Fixed a bug in removeSlashes: An escape sequence at the third and second to last position was not handled correctly. Example: "
aa" was transformed to "\a" instead of "\aa"
Also almost doubled removeSlashes and removeSlashes performance.

  • Property svn:eol-style set to native
File size: 16.0 KB
RevLine 
[1505]1/*
2 *   ORXONOX - the hottest 3D action shooter ever to exist
3 *                    > www.orxonox.net <
4 *
5 *
6 *   License notice:
7 *
8 *   This program is free software; you can redistribute it and/or
9 *   modify it under the terms of the GNU General Public License
10 *   as published by the Free Software Foundation; either version 2
11 *   of the License, or (at your option) any later version.
12 *
13 *   This program is distributed in the hope that it will be useful,
14 *   but WITHOUT ANY WARRANTY; without even the implied warranty of
15 *   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16 *   GNU General Public License for more details.
17 *
18 *   You should have received a copy of the GNU General Public License
19 *   along with this program; if not, write to the Free Software
20 *   Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301, USA.
21 *
22 *   Author:
23 *      Fabian 'x3n' Landau
24 *   Co-authors:
25 *      Benjamin Grauer
26 *
27 */
28
[1791]29/**
[2171]30    @file
[1791]31    @brief Implementation of several string manipulation functions.
32*/
33
[3250]34#include "StringUtils.h"
[1505]35
36#include <cctype>
[2087]37#include "Convert.h"
38#include "Math.h"
[1625]39
[2171]40namespace orxonox
[2087]41{
[6417]42    std::string BLANKSTRING;
[2087]43
[2171]44    std::string getUniqueNumberString()
45    {
[3280]46        return multi_cast<std::string>(getUniqueNumber());
[2171]47    }
[1505]48
[2171]49    /**
50        @brief Removes all whitespaces from a string.
51        @param str The string to strip
52    */
53    void strip(std::string* str)
54    {
55        size_t pos;
[6417]56        while ((pos = str->find(' ')) < str->length())
57            str->erase(pos, 1);
58        while ((pos = str->find('\t')) < str->length())
59            str->erase(pos, 1);
60        while ((pos = str->find('\n')) < str->length())
61            str->erase(pos, 1);
[2171]62    }
[1505]63
[2171]64    /**
65        @brief Returns a copy of a string without whitespaces.
66        @param str The string to strip
67        @return The stripped line
68    */
69    std::string getStripped(const std::string& str)
70    {
[6417]71        std::string output(str);
[2171]72        strip(&output);
73        return output;
74    }
[1505]75
[2171]76    /**
77        @brief Returns a copy of a string without trailing whitespaces.
78        @param str The string
79        @return The modified copy
80    */
81    std::string removeTrailingWhitespaces(const std::string& str)
82    {
83        size_t pos1 = 0;
[3300]84        int pos2 = static_cast<int>(str.size() - 1);
[2171]85        for (; pos1 < str.size() && (str[pos1] == ' ' || str[pos1] == '\t' || str[pos1] == '\n'); pos1++);
86        for (; pos2 > 0         && (str[pos2] == ' ' || str[pos2] == '\t' || str[pos2] == '\n'); pos2--);
87        return str.substr(pos1, pos2 - pos1 + 1);
88    }
[1505]89
[2171]90    /**
91        @brief Returns the position of the next quote in the string, starting with start.
92        @param str The string
93        @param start The startposition
94        @return The position of the next quote (std::string::npos if there is no next quote)
95    */
96    size_t getNextQuote(const std::string& str, size_t start)
[1505]97    {
[2171]98        size_t quote = start - 1;
99
[6417]100        while ((quote = str.find('"', quote + 1)) != std::string::npos)
[2171]101        {
102            size_t backslash = quote;
103            size_t numbackslashes = 0;
104            for (; backslash > 0; backslash--, numbackslashes++)
105                if (str[backslash - 1] != '\\')
106                    break;
107
108            if (numbackslashes % 2 == 0)
[1505]109                break;
[2171]110        }
[1505]111
[2171]112        return quote;
[1505]113    }
114
[2171]115    /**
116        @brief Returns true if pos is between two quotes.
117        @param str The string
118        @param pos The position to check
119        @return True if pos is between two quotes
120    */
121    bool isBetweenQuotes(const std::string& str, size_t pos)
[1505]122    {
[2171]123        if (pos == std::string::npos)
[1830]124            return false;
[1505]125
[2171]126        size_t quotecount = 0;
[3301]127        size_t quote = static_cast<size_t>(-1);
[2171]128        while ((quote = getNextQuote(str, quote + 1)) < pos)
129        {
130            if (quote == pos)
131                return false;
132            quotecount++;
133        }
[1505]134
[2171]135        if (quote == std::string::npos)
136            return false;
[1505]137
[2171]138        return ((quotecount % 2) == 1);
139    }
[1505]140
[2171]141    /**
142        @brief Returns true if the string contains something like '..."between quotes"...'.
143        @param The string
144        @return True if there is something between quotes
145    */
146    bool hasStringBetweenQuotes(const std::string& str)
147    {
148        size_t pos1 = getNextQuote(str, 0);
149        size_t pos2 = getNextQuote(str, pos1 + 1);
150        return (pos1 != std::string::npos && pos2 != std::string::npos && pos2 > pos1 + 1);
151    }
[1505]152
[2171]153    /**
154        @brief If the string contains something like '..."between quotes"...' then 'between quotes' gets returned (without quotes).
155        @param The string
156        @param The string between the quotes
157    */
158    std::string getStringBetweenQuotes(const std::string& str)
159    {
160        size_t pos1 = getNextQuote(str, 0);
161        size_t pos2 = getNextQuote(str, pos1 + 1);
162        if (pos1 != std::string::npos && pos2 != std::string::npos)
163            return str.substr(pos1, pos2 - pos1 + 1);
164        else
165            return "";
166    }
[1505]167
[2171]168    /**
169        @brief Removes enclosing quotes if available (including whitespaces at the outside of the quotes).
170        @brief str The string to strip
171        @return The string with removed quotes
172    */
173    std::string stripEnclosingQuotes(const std::string& str)
[1505]174    {
[2171]175        size_t start = std::string::npos;
176        size_t end = 0;
177
178        for (size_t pos = 0; (pos < str.size()) && (pos < std::string::npos); pos++)
[1505]179        {
[2171]180            if (str[pos] == '"')
181            {
182                start = pos;
183                break;
184            }
185
186            if ((str[pos] != ' ') && (str[pos] != '\t') && (str[pos] != '\n'))
187                return str;
[1505]188        }
189
[2171]190        for (size_t pos = str.size() - 1; pos < std::string::npos; pos--)
191        {
192            if (str[pos] == '"')
193            {
194                end = pos;
195                break;
196            }
[1505]197
[2171]198            if ((str[pos] != ' ') && (str[pos] != '\t') && (str[pos] != '\n'))
199                return str;
[1505]200        }
201
[2171]202        if ((start != std::string::npos) && (end != 0))
203            return str.substr(start + 1, end - start - 1);
204        else
[1505]205            return str;
206    }
207
[2171]208    /**
209        @brief Removes enclosing {braces} (braces must be exactly on the beginning and the end of the string).
210        @param str The string to strip
211        @return The striped string
212    */
213    std::string stripEnclosingBraces(const std::string& str)
214    {
215        std::string output = str;
[1505]216
[2171]217        while (output.size() >= 2 && output[0] == '{' && output[output.size() - 1] == '}')
218            output = output.substr(1, output.size() - 2);
[1505]219
[2171]220        return output;
221    }
[1505]222
[2171]223    /**
224        @brief Determines if a string is a comment (starts with a comment-symbol).
225        @param str The string to check
226        @return True = it's a comment
[1505]227
[2171]228        A comment is defined by a leading '#', '%', ';' or '//'.
229    */
230    bool isComment(const std::string& str)
231    {
232        // Strip the line, whitespaces are disturbing
[6417]233        const std::string& teststring = getStripped(str);
[1505]234
[2171]235        // There are four possible comment-symbols:
236        //  1) #comment in script-language style
237        //  2) %comment in matlab style
238        //  3) ;comment in unreal tournament config-file style
239        //  4) //comment in code style
240        if (teststring.size() >= 2)
241        {
242            if (teststring[0] == '#' || teststring[0] == '%' || teststring[0] == ';' || (teststring[0] == '/' && teststring[1] == '/'))
243                return true;
244        }
245        else if (teststring.size() == 1)
246        {
247            if (teststring[0] == '#' || teststring[0] == '%' || teststring[0] == ';')
248                return true;
249        }
[1505]250
[2171]251        return false;
[1505]252    }
[2171]253
254    /**
255        @brief Determines if a string is empty (contains only whitespaces).
256        @param str The string to check
257        @return True = it's empty
258    */
259    bool isEmpty(const std::string& str)
[1505]260    {
[6417]261        return getStripped(str).empty();
[1505]262    }
263
[2171]264    /**
265        @brief Determines if a string contains only numbers and maximal one '.'.
266        @param str The string to check
267        @return True = it's a number
268    */
269    bool isNumeric(const std::string& str)
270    {
271        bool foundPoint = false;
[1505]272
[2171]273        for (std::string::const_iterator it = str.begin(); it != str.end(); ++it)
[1505]274        {
[2171]275            if (((*it) < '0' || (*it) > '9'))
276            {
277                if ((*it) != '.' && !foundPoint)
278                    foundPoint = true;
279                else
280                    return false;
281            }
[1505]282        }
[2171]283
284        return true;
[1505]285    }
286
[2171]287    /**
288        @brief Adds backslashes to the given string which makes special chars visible. Existing slashes will be doubled.
289        @param str The string to manipulate
290        @return The string with added slashes
291    */
292    std::string addSlashes(const std::string& str)
293    {
[6424]294        std::string output(str.size() * 2, ' ');
295        size_t i = 0;
296        for (size_t pos = 0; pos < str.size(); ++pos)
297        {
298            switch (str[pos])
299            {
300            case '\\': output[i] = '\\'; output[i + 1] = '\\'; break;
301            case '\n': output[i] = '\\'; output[i + 1] =  'n'; break;
302            case '\t': output[i] = '\\'; output[i + 1] =  't'; break;
303            case '\v': output[i] = '\\'; output[i + 1] =  'v'; break;
304            case '\b': output[i] = '\\'; output[i + 1] =  'b'; break;
305            case '\r': output[i] = '\\'; output[i + 1] =  'r'; break;
306            case '\f': output[i] = '\\'; output[i + 1] =  'f'; break;
307            case '\a': output[i] = '\\'; output[i + 1] =  'a'; break;
308            case  '"': output[i] = '\\'; output[i + 1] =  '"'; break;
309            case '\0': output[i] = '\\'; output[i + 1] =  '0'; break;
310            default  : output[i] = str[pos]; ++i; continue;
311            }
312            i += 2;
313        }
314        output.resize(i);
[1505]315
[2171]316        return output;
317    }
[1505]318
[2171]319    /**
320        @brief Removes backslashes from the given string. Double backslashes are interpreted as one backslash.
321        @param str The string to manipulate
322        @return The string with removed slashes
323    */
324    std::string removeSlashes(const std::string& str)
325    {
326        if (str.size() <= 1)
327            return str;
[1505]328
[6424]329        std::string output(str.size(), ' ');
330        size_t i = 0;
331        size_t pos = 0;
332        while (pos < str.size() - 1)
[2171]333        {
334            if (str[pos] == '\\')
335            {
[6424]336                switch (str[pos + 1])
337                {
338                case '\\': output[i] = '\\'; break;
339                case  'n': output[i] = '\n'; break;
340                case  't': output[i] = '\t'; break;
341                case  'v': output[i] = '\v'; break;
342                case  'b': output[i] = '\b'; break;
343                case  'r': output[i] = '\r'; break;
344                case  'f': output[i] = '\f'; break;
345                case  'a': output[i] = '\a'; break;
346                case  '"': output[i] =  '"'; break;
347                case  '0': output[i] = '\0'; break;
348                default: ++pos; continue;
349                }
350                pos += 2; ++i;
[2171]351            }
[6424]352            else
353                output[i++] = str[pos++];
[2171]354        }
[6424]355        if (pos < str.size())
356            output[i++] = str[pos];
357        output.resize(i);
[1505]358
[2171]359        return output;
360    }
361
362    /**
363        @brief Replaces each char between A and Z with its lowercase equivalent.
364        @param str The string to convert
365    */
366    void lowercase(std::string* str)
[1505]367    {
[2171]368        for (size_t i = 0; i < str->size(); ++i)
[1505]369        {
[3300]370            (*str)[i] = static_cast<char>(tolower((*str)[i]));
[1505]371        }
372    }
373
[2171]374    /**
375        @brief Returns a copy of the given string without uppercase chars.
376        @param str The string
377        @return The copy
378    */
379    std::string getLowercase(const std::string& str)
380    {
[6417]381        std::string output(str);
[2171]382        lowercase(&output);
383        return output;
384    }
[1505]385
[2171]386    /**
387        @brief Replaces each char between a and z with its uppercase equivalent.
388        @param str The string to convert
389    */
390    void uppercase(std::string* str)
[1505]391    {
[2171]392        for (size_t i = 0; i < str->size(); ++i)
393        {
[3300]394            (*str)[i] = static_cast<char>(toupper((*str)[i]));
[2171]395        }
[1505]396    }
397
[2171]398    /**
399        @brief Returns a copy of the given string without lowercase chars.
400        @param str The string
401        @return The copy
402    */
403    std::string getUppercase(const std::string& str)
404    {
[6417]405        std::string output(str);
[2171]406        uppercase(&output);
407        return output;
408    }
[1505]409
[2171]410    /**
411        @brief Compares two strings ignoring different casing.
412        @param s1 First string
413        @param s2 Second string
414    */
415    int nocaseCmp(const std::string& s1, const std::string& s2)
[1505]416    {
[2171]417        std::string::const_iterator it1=s1.begin();
418        std::string::const_iterator it2=s2.begin();
419
420        //stop when either string's end has been reached
421        while ( (it1!=s1.end()) && (it2!=s2.end()) )
422        {
423            if(::toupper(*it1) != ::toupper(*it2)) //letters differ?
424                // return -1 to indicate smaller than, 1 otherwise
425                return (::toupper(*it1)  < ::toupper(*it2)) ? -1 : 1;
426            //proceed to the next character in each string
427            ++it1;
428            ++it2;
429        }
430        size_t size1=s1.size(), size2=s2.size();// cache lengths
431        //return -1,0 or 1 according to strings' lengths
432        if (size1==size2)
433            return 0;
434        return (size1<size2) ? -1 : 1;
[1505]435    }
436
437
[2171]438    /**
439        @brief Compares the first 'len' chars of two strings ignoring different casing.
440        @param s1 First string
441        @param s2 Second string
442        @param len Maximal number of chars to compare
443    */
444    int nocaseCmp(const std::string& s1, const std::string& s2, size_t len)
[1505]445    {
[2171]446        if (len == 0)
447            return 0;
448        std::string::const_iterator it1=s1.begin();
449        std::string::const_iterator it2=s2.begin();
[1505]450
[2171]451        //stop when either string's end has been reached
452        while ( (it1!=s1.end()) && (it2!=s2.end()) && len-- > 0)
453        {
454            if(::toupper(*it1) != ::toupper(*it2)) //letters differ?
455                // return -1 to indicate smaller than, 1 otherwise
456                return (::toupper(*it1)  < ::toupper(*it2)) ? -1 : 1;
457            //proceed to the next character in each string
458            ++it1;
459            ++it2;
460        }
[1505]461        return 0;
[2171]462    }
[1505]463
[2171]464    /**
465        @brief Returns true if the string contains a comment, introduced by #, %, ; or //.
466        @param str The string
467        @return True if the string contains a comment
468    */
469    bool hasComment(const std::string& str)
[1505]470    {
[2171]471        return (getCommentPosition(str) != std::string::npos);
[1505]472    }
473
[2171]474    /**
475        @brief If the string contains a comment, the comment gets returned (including the comment symbol), an empty string otherwise.
476        @param str The string
477        @return The comment
478    */
479    std::string getComment(const std::string& str)
480    {
481        return str.substr(getCommentPosition(str));
482    }
[1505]483
[2171]484    /**
485        @brief If the string contains a comment, the position of the comment-symbol gets returned, std::string::npos otherwise.
486        @param str The string
487        @return The position
488    */
489    size_t getCommentPosition(const std::string& str)
490    {
491        return getNextCommentPosition(str, 0);
492    }
[1505]493
[2171]494    /**
495        @brief Returns the position of the next comment-symbol, starting with start.
496        @param str The string
497        @param start The startposition
498        @return The position
499    */
500    size_t getNextCommentPosition(const std::string& str, size_t start)
501    {
502        for (size_t i = start; i < str.size(); i++)
503            if (isComment(str.substr(i)))
504                return i;
[1505]505
[2171]506        return std::string::npos;
507    }
[3327]508
509    /**
510        @brief Replaces individual charaters
511        @param str String to be manipulated
512        @param target Character to be replaced
513        @param replacement Replacement character
514        @return Number of replacements
515    */
516    _UtilExport size_t replaceCharacters(std::string& str, char target, char replacement)
517    {
518        size_t j = 0;
519        for (size_t i = 0; i < str.size(); ++i)
520        {
521            if (str[i] == target)
522            {
523                str[i] = replacement;
524                ++j;
525            }
526        }
527        return j;
528    }
[1505]529}
Note: See TracBrowser for help on using the repository browser.