字符串操作大全:面试准备和日常编码所需一文打尽

本文转载自公众号“读芯术”(ID:AI_Discovery)。

字符串是一系列字符,由常数或变量构成。它是编程语言中必不可少的数据类型。本文中将重点关注JavaScript字符串操作,但其原理和算法也可应用于其他语言。

参加技术面试时,面试官常常会关注以下内容:

  • 编程技术
  • 语言能力
  • 解题技巧

本文不仅可以让你成功通过技术面试,对日常编码也很有用。代码要点格式中,我们列出了JavaScript字符串的几点重要特性,这是编程技能的基础。其中包括存在了20年的属性和方法,也涵盖ES2021中的特性。如有不清楚之处,可以有针对性地查漏补缺。JavaScript编程语言可以解决许多应用问题。这些算法或其变体,经常出现在真实的面试场景中。

字符串属性和方法

字符串用于表示和操作字符序列。字符串属性和方法有很多。以下是可供参考的代码示例,包括ES2020中的“matchAll”和ES2021中的“replaceAll”。

 
 
 
 
  1. const str = Today is a nice day! ;   
  2.       console.log(str.length); // 20 
  3.       console.log(str[2]); // "d" 
  4.       console.log(typeof str); // "string" 
  5.       console.log(typeof str[2]); // "string" 
  6.       console.log(typeofString(5)); //"string" 
  7.       console.log(typeofnewString(str)); //"object" 
  8.       console.log(str.indexOf( is )); // 6 
  9.       console.log(str.indexOf( today )); // -1 
  10.       console.log(str.includes( is )); // true 
  11.       console.log(str.includes( IS )); // false 
  12.       console.log(str.startsWith( Today )); // true 
  13.       console.log(str.endsWith( day )); // false 
  14.       console.log(str.split(   )); // ["Today", "is", "a", "nice","day!"] 
  15.       console.log(str.split(  )); // ["T", "o", "d", "a","y", " ", "i", "s", " ","a", " ", "n", "i", "c","e", " ", "d", "a", "y","!"] 
  16.       console.log(str.split( a )); // ["Tod", "y is ", " nice d","y!"] 
  17.       console.log(str +1+2); // "Today is a nice day!12" 
  18.       console.log(str + str); // "Today is a nice day!Today is a niceday!" 
  19.       console.log(str.concat(str)); // "Today is a nice day!Today is a niceday!" 
  20.       console.log(str.repeat(2)); // "Today is a nice day!Today is a nice day!" 
  21.       console.log( abc < bcd ); // true 
  22.       console.log( abc .localeCompare( bcd )); // -1 
  23.       console.log( a .localeCompare( A )); // -1 
  24.       console.log( a .localeCompare( A , undefined, { numeric: true })); // -1 
  25.       console.log( a .localeCompare( A , undefined, { sensitivity:  accent  })); // 0 
  26.       console.log( a .localeCompare( A , undefined, { sensitivity:  base  })); // 0 
  27.       console.log( a .localeCompare( A! , undefined, { sensitivity:  base , ignorePunctuation: true })); // 0 
  28.       console.log( abc .toLocaleUpperCase()); // "ABC" 
  29.       console.log(str.padStart(25,  * )); // "*****Todayis a nice day!" 
  30.       console.log(str.padEnd(22,  ! )); // "Today is anice day!!!" 
  31.       console.log(    middle  .trim().length); // 6 
  32.       console.log(    middle  .trimStart().length); // 8 
  33.       console.log(    middle  .trimEnd().length); // 9 
  34.       console.log(str.slice(6, 8)); // "is" 
  35.       console.log(str.slice(-4)); // "day!" 
  36.       console.log(str.substring(6, 8)); // "is" 
  37.       console.log(str.substring(-4)); // "Today is a nice day!" 
  38.       console.log( a .charCodeAt()); // 97 
  39.       console.log(String.fromCharCode(97)); // "a" 
  40.       console.log(str.search(/[a-c]/)); // 3 
  41.       console.log(str.match(/[a-c]/g)); // ["a", "a", "c", "a"] 
  42.       console.log([...str.matchAll(/[a-c]/g)]); 
  43.       // [Array(1), Array(1), Array(1), Array(1)] 
  44.       // 0: ["a", index: 3, input: "Today is a nice day!",groups: undefined] 
  45.       // 1: ["a", index: 9, input: "Today is a nice day!",groups: undefined] 
  46.       // 2: ["c", index: 13, input: "Today is a niceday!", groups: undefined] 
  47.       // 3: ["a", index: 17, input: "Today is a niceday!", groups: undefined] 
  48.       console.log([... test1test2 .matchAll(/t(e)(st(d?))/g)]); 
  49.       // [Array(4), Array(4)] 
  50.       // 0: (4) ["test1", "e", "st1","1", index: 0, input: "test1test2", groups: undefined] 
  51.       // 1: (4) ["test2", "e", "st2","2", index: 5, input: "test1test2", groups: undefined] 
  52.       console.log(str.replace( a ,  z )); // Todzy is anice day! 
  53.       console.log(str.replace(/[a-c]/,  z )); // Todzy is anice day! 
  54.       console.log(str.replace(/[a-c]/g,  z )); // Todzy is znize dzy! 
  55.       console.log(str.replaceAll( a ,  z )); // Todzy is znice dzy! 
  56.       console.log(str.replaceAll(/[a-c]/g,  z )); // Todzy is znize dzy! 
  57.       console.log(str.replaceAll(/[a-c]/,  z )); // TypeError:String.prototype.replaceAll called with a non-global RegExp argument 

映射和集合

对于字符串操作,我们需要在某处存储中间值。数组、映射和集合都是需要掌握的常用数据结构,本文主要讨论集合和映射。

(1) 集合

Set是存储所有类型的唯一值的对象。以下是供参考的代码示例,一目了然。

 
 
 
 
  1. const set =newSet( aabbccdefghi );  
  2.                        console.log(set.size); // 9 
  3.                        console.log(set.has( d )); // true 
  4.                        console.log(set.has( k )); // false 
  5.                        console.log(set.add( k )); // {"a", "b", "c", "d","e" "f", "g", "h", "i","k"} 
  6.                        console.log(set.has( k )); // true 
  7.                        console.log(set.delete( d )); // true 
  8.                        console.log(set.has( d )); // false 
  9.                        console.log(set.keys()); // {"a", "b", "c","e" "f", "g", "h", "i","k"} 
  10.                        console.log(set.values()); // {"a", "b", "c","e" "f", "g", "h", "i","k"} 
  11.                        console.log(set.entries()); // {"a" => "a","b" => "b", "c" => "c","e" => "e", 
  12.                        // "f"=> "f", "g" => "g", "h" =>"h"}, "i" => "i", "k" =>"k"} 
  13.                        const set2 =newSet(); 
  14.                        set.forEach(item => set2.add(item.toLocaleUpperCase())); 
  15.                        set.clear(); 
  16.                        console.log(set); // {} 
  17.                        console.log(set2); //{"A", "B", "C", "E", "F","G", "H", "I", "K"} 
  18.                        console.log(newSet([{ a: 1, b: 2, c: 3 }, { d: 4, e: 5 }, { d: 4, e: 5 }])); 
  19.                        // {{a: 1, b: 2,c: 3}, {d: 4, e: 5}, {d: 4, e: 5}} 
  20.                        const item = { f: 6, g: 7 }; 
  21.                        console.log(newSet([{ a: 1, b: 2, c: 3 }, item, item])); 
  22.                        // {{a: 1, b: 2,c: 3}, {f: 6, g: 7}} 

(2) 映射

映射是保存键值对的对象。任何值都可以用作键或值。映射会记住键的原始插入顺序。以下是供参考的代码示例:

 
 
 
 
  1. const map =newMap();    
  2.       console.log(map.set(1,  first )); // {1 =>"first"} 
  3.       console.log(map.set( a ,  second )); // {1 =>"first", "a" => "second"} 
  4.       console.log(map.set({ obj:  123  }, [1, 2, 3])); 
  5.       // {1 => "first", "a" =>"second", {obj: "123"} => [1, 2, 3]} 
  6.       console.log(map.set([2, 2, 2], newSet( abc ))); 
  7.       // {1 => "first", "a" => "second",{obj: "123"} => [1, 2, 3], [2, 2, 2] => {"a","b", "c"}} 
  8.       console.log(map.size); // 4 
  9.       console.log(map.has(1)); // true 
  10.       console.log(map.get(1)); // "first" 
  11.       console.log(map.get( a )); // "second" 
  12.       console.log(map.get({ obj:  123  })); // undefined 
  13.       console.log(map.get([2, 2, 2])); // undefined 
  14.       console.log(map.delete(1)); // true 
  15.       console.log(map.has(1)); // false 
  16.       const arr = [3, 3]; 
  17.       map.set(arr, newSet( xyz )); 
  18.       console.log(map.get(arr)); // {"x", "y", "z"} 
  19.       console.log(map.keys()); // {"a", {obj: "123"}, [2, 2,2], [3, 3]} 
  20.       console.log(map.values()); // {"second", [1, 2, 3], {"a","b", "c"}, {"x", "y", "z"}} 
  21.       console.log(map.entries()); 
  22.       // {"a" => "second", {obj: "123"}=> [1, 2, 3], [2, 2, 2] => {"a", "b", "c"},[3, 3] => {"x", "y", "z"}} 
  23.       const map2 =newMap([[ a , 1], [ b , 2], [ c , 3]]); 
  24.       map2.forEach((value, key, map) => console.log(`value = ${value}, key = ${key}, map = ${map.size}`)); 
  25.       // value = 1, key = a, map = 3 
  26.       // value = 2, key = b, map = 3 
  27.       // value = 3, key = c, map = 3 
  28.       map2.clear(); 
  29.       console.log(map2.entries()); // {} 

应用题

面试中有英语应用题,我们探索了一些经常用于测试的算法。

(1) 等值线

等值线图是指所含字母均只出现一次的单词。

  • dermatoglyphics (15个字母)
  • hydropneumatics (15个字母)
  • misconjugatedly (15个字母)
  • uncopyrightable (15个字母)
  • uncopyrightables (16个字母)
  • subdermatoglyphic (17个字母)

如何写一个算法来检测字符串是否是等值线图?有很多方法可以实现。可以把字符串放在集合中,然后自动拆分成字符。由于集合是存储唯一值的对象,如果它是一个等值线图,它的大小应该与字符串长度相同。

 
 
 
 
  1. /** 
  2.     * An algorithm to verify whethera given string is an isogram 
  3.     * @param {string} str The string to be verified 
  4.     * @return {boolean} Returns whether it is an isogram 
  5.     */ 
  6.    functionisIsogram(str) { 
  7.     if (!str) { 
  8.        returnfalse; 
  9.     } 
  10.     
  11.         const set =newSet(str); 
  12.     return set.size=== str.length; 
  13.    } 

以下是验证测试:

 
 
 
 
  1. console.log(isIsogram(  )); // false  
  2.                             console.log(isIsogram( a )); // true 
  3.                             console.log(isIsogram( misconjugatedly )); // true 
  4.                             console.log(isIsogram( misconjugatledly )); // false 

(2) 全字母短句

全字母短句是包含字母表中所有26个字母的句子,不分大小写。理想情况下,句子越短越好。以下为全字母短句:

  • Waltz, bad nymph, for quick jigs vex. (28个字母)
  • Jived fox nymph grabs quick waltz. (28个字母)
  • Glib jocks quiz nymph to vex dwarf. (28个字母)
  • Sphinx of black quartz, judge my vow. (29个字母)
  • How vexingly quick daft zebras jump! (30个字母)
  • The five boxing wizards jump quickly. (31个字母)
  • Jackdaws love my big sphinx of quartz. (31个字母)
  • Pack my box with five dozen liquor jugs. (32个字母)
  • The quick brown fox jumps over a lazy dog. (33个字母)

还有很多方法可以验证给定的字符串是否是全字母短句。这一次,我们将每个字母(转换为小写)放入映射中。如果映射大小为26,那么它就是全字母短句。

 
 
 
 
  1. /**    
  2.     * An algorithm to verify whethera given string is a pangram 
  3.     * @param {string} str The string to be verified 
  4.     * @return {boolean} Returns whether it is a pangram 
  5.     */ 
  6.    functionisPangram(str) { 
  7.     const len = str.length; 
  8.     if (len <26) { 
  9.        returnfalse; 
  10.     } 
  11.                const map =newMap(); 
  12.     for (let i =0; i < len; i++) { 
  13.        if (str[i].match(/[a-z]/i)) { // if it is letter a to z, ignoring the case 
  14.          map.set(str[i].toLocaleLowerCase(), true); // use lower case letter as a key 
  15.        } 
  16.     } 
  17.     return map.size===26; 
  18.    } 

以下是验证测试:

 
 
 
 
  1. console.log(isPangram(  )); // false  
  2.                             console.log(isPangram( Bawds jog, flick quartz, vex nymphs. )); // true 
  3.                             console.log(isPangram( The quick brown fox jumped over the lazy sleepingdog. )); // true 
  4.                             console.log(isPangram( Roses are red, violets are blue, sugar is sweet,and so are you. )); // false 

(3) 同构字符串

给定两个字符串s和t,如果可以替换掉s中的字符得到t,那么这两个字符串是同构的。s中的所有字符转换都必须应用到s中相同的字符上,例如,murmur与tartar为同构字符串,如果m被t替换,u被a替换,r被自身替换。以下算法使用数组来存储转换字符,也适用于映射。

 
 
 
 
  1. /** 
  2.     * An algorithm to verify whethertwo given strings are isomorphic 
  3.     * @param {string} s The first string 
  4.     * @param {string} t The second string 
  5.     * @return {boolean} Returns whether these two strings are isomorphic 
  6.     */ 
  7.    functionareIsomorphic(s, t) { 
  8.     // strings with different lengths are notisomorphic 
  9.     if (s.length !== t.length) { 
  10.          returnfalse; 
  11.     } 
  12.                // the conversion array 
  13.     const convert = []; 
  14.     for (let i =0; i < s.length; i++) { 
  15.          // if the conversioncharacter exists 
  16.          if (convert[s[i]]) { 
  17.              // apply the conversion and compare 
  18.              if (t[i] === convert[s[i]]) { // so far so good 
  19.                  continue; 
  20.              } 
  21.              returnfalse; // not isomorphic 
  22.          } 
  23.                    // set the conversion character for future use 
  24.          convert[s[i]] = t[i]; 
  25.     } 
  26.                // these two strings are isomorphic since there are no violations 
  27.     returntrue; 
  28.    }; 

以下是验证测试:

 
 
 
 
  1. onsole.log(areIsomorphic( atlatl ,  tartar )); // true 
  2.                                     console.log(areIsomorphic( atlatlp ,  tartarq )); // true 
  3.                                     console.log(areIsomorphic( atlatlpb ,  tartarqc )); // true 
  4.                                     console.log(areIsomorphic( atlatlpa ,  tartarqb )); // false 

(4) 相同字母异构词

相同字母异构词是通过重新排列不同单词的字母而形成的单词,通常使用所有原始字母一次。从一个池中重新排列单词有很多种可能性。例如,cat的相同字母异构词有cat、act、atc、tca、atc和tac。我们可以添加额外的要求,即新单词必须出现在源字符串中。如果源实际上是actually,则结果数组是[“act”]。

 
 
 
 
  1. /** 
  2.     * Given a pool to compose ananagram, show all anagrams contained (continuously) in the source 
  3.     * @param {string} source A source string to draw an anagram from 
  4.     * @param {string} pool A pool to compose an anagram 
  5.     * @return {array} Returns an array of anagrams that are contained by the source string 
  6.     */ 
  7.    functionshowAnagrams(source, pool) { 
  8.     // if source is not long enough to hold theanagram 
  9.     if (source.length< pool.length) { 
  10.        return []; 
  11.     } 
  12.                const sourceCounts = []; // an array tohold the letter counts in source 
  13.     const poolCounts = []; // an array tohold the letter counts in pool 
  14.                // initialize counts for 26 letters to be 0 
  15.     for (let i =0; i <26; i++) { 
  16.        sourceCounts[i] =0; 
  17.        poolCounts[i] =0; 
  18.     } 
  19.                // convert both strings to lower cases 
  20.     poolpool = pool.toLocaleLowerCase(); 
  21.     const lowerSource = source.toLocaleLowerCase(); 
  22.                for (let i =0; i < pool.length; i++) { 
  23.         // calculatepoolCounts for each letter in pool, mapping a - z to 0 - 25 
  24.        poolCounts[pool[i].charCodeAt() -97]++; 
  25.     } 
  26.                const result = []; 
  27.     for (let i =0; i < lowerSource.length; i++) { 
  28.        // calculatesourceCounts for each letter for source, mapping a - z to 0 - 25 
  29.        sourceCounts[lowerSource[i].charCodeAt() -97]++; 
  30.        if (i >= pool.length-1) { // if source islong enough 
  31.          // if sourceCountsis the same as poolCounts 
  32.          if (JSON.stringify(sourceCounts) ===JSON.stringify(poolCounts)) { 
  33.            // save the found anagram, using the original source to make stringcase-preserved 
  34.            result.push(source.slice(i - pool.length+1, i +1)); 
  35.          } 
  36.          // shift thestarting window by 1 index (drop the current first letter) 
  37.          sourceCounts[lowerSource[i - pool.length+1].charCodeAt() -97]--; 
  38.        } 
  39.     } 
  40.           // removeduplicates by a Set 
  41.     return [...newSet(result)]; 
  42.    } 

以下是验证测试:

 
 
 
 
  1. console.log(showAnagrams( AaaAAaaAAaa ,  aa )); // ["Aa", "aa", "aA", "AA"] 
  2.                                         console.log(showAnagrams( CbatobaTbacBoat ,  Boat ));  //["bato", "atob", "toba", "obaT","Boat"] 
  3.                                         console.log(showAnagrams( AyaKkayakkAabkk ,  Kayak )); 
  4.                                         // ["AyaKk", "yaKka", "aKkay", "Kkaya","kayak", "ayakk", "yakkA"] 

(5) 回文

回文是从前往后读和从后往前读读法相同的单词或句子。有很多回文,比如A,Bob,还有 “A man, a plan, a canal — Panama”。检查回文的算法分为两种。使用循环或使用递归从两端检查是否相同。下列代码使用递归方法:

 
 
 
 
  1. /** 
  2.     * An algorithm to verify whethera given string is a palindrome 
  3.     * @param {string} str The string to be verified 
  4.     * @return {boolean} Returns whether it is a palindrome 
  5.     */ 
  6.    functionisPalindrome(str) { 
  7.     functioncheckIsPalindrome(s) { 
  8.        // empty stringor one letter is a defecto palindrome 
  9.        if (s.length<2) { 
  10.          returntrue; 
  11.        } 
  12.                  if ( // if two ends notequal, ignoring the case 
  13.          s[0].localeCompare(s[s.length-1], undefined, { 
  14.            sensitivity:  base , 
  15.          }) !== 0 
  16.        ) { 
  17.          returnfalse; 
  18.        } 
  19.                  // since two ends equal, checking the inside 
  20.        returncheckIsPalindrome(s.slice(1, -1)); 
  21.     } 
  22.      
  23.     // check whether it is a palindrome, removing noneletters and digits 
  24.     returncheckIsPalindrome(str.replace(/[^A-Za-z0-9]/g,   )); 
  25.    } 

以下是验证测试:

 
 
 
 
  1. console.log(isPalindrome(  )); // true 
  2.                                console.log(isPalindrome( a )); // true 
  3.                                console.log(isPalindrome( Aa )); // true 
  4.                                console.log(isPalindrome( Bob )); // true 
  5.                                console.log(isPalindrome( Odd or even )); // false 
  6.                                console.log(isPalindrome( Never odd or even )); // true 
  7.                                console.log(isPalindrome( 02/02/2020 )); // true 
  8.                                console.log(isPalindrome( 2/20/2020 )); // false 
  9.                                console.log(isPalindrome( A man, a plan, a canal – Panama )); // true 

回文面试题有很多不同的变形题,下面是一个在给定字符串中寻找最长回文的算法。

 
 
 
 
  1. /**                                        
  2.     * An algorithm to find thelongest palindrome in a given string 
  3.     * @param {string} source The source to find the longest palindrome from 
  4.     * @return {string} Returns the longest palindrome 
  5.     */ 
  6.    functionfindLongestPalindrome(source) { 
  7.     // convert to lower cases and only keep lettersand digits 
  8.     constlettersAndDigits = source.replace(/[^A-Za-z0-9]/g,   ); 
  9.     const str = lettersAndDigits.toLocaleLowerCase(); 
  10.                const len = str.length; 
  11.               // empty string or one letter is a defecto palindrome 
  12.     if (len <2) { 
  13.        return str; 
  14.     } 
  15.                // the first letter is the current longest palindrome 
  16.     let maxPalindrome = lettersAndDigits[0]; 
  17.                // assume that the index is the middle of a palindrome 
  18.     for (let i =0; i < len; i++) { 
  19.                  // try the case that the palindrome has one middle 
  20.        for ( 
  21.          let j =1; // start with onestep away (inclusive) 
  22.          j < len &&// end with the len end (exclusive) 
  23.          i - j >= 0&&// cannot pass the start index (inclusive) 
  24.          i + j < len &&// cannot exceed end index (exclusive) 
  25.          Math.min(2 * i +1, 2 * (len - i) -1) > maxPalindrome.length; // potential max length should be longer than thecurrent length 
  26.          j++ 
  27.        ) { 
  28.          if (str[i - j] !== str[i + j]) { // if j stepsbefore the middle is different from j steps after the middle 
  29.            break; 
  30.          } 
  31.          if (2 * j +1> maxPalindrome.length) { // if it is longerthan the current length 
  32.            maxPalindrome = lettersAndDigits.slice(i - j, i + j +1); // j steps before, middle, and j steps after 
  33.          } 
  34.        } 
  35.                  // try the case that the palindrome has two middles 
  36.        if (i < len -1&& str[i] === str[i +1]) { // if two middles are the same 
  37.          if (maxPalindrome.length<2) { // the string withtwo middles could be the current longest palindrome 
  38.            maxPalindrome = lettersAndDigits.slice(i, i +2); 
  39.          } 
  40.          for ( 
  41.            let j =1; // start with one step away (inclusive) 
  42.            j < len -1&&// end with the len - 1 end (exclusive) 
  43.            i - j >= 0&&// cannot pass the start index (inclusive) 
  44.            i + j +1< len &&// cannot exceed end index (exclusive) 
  45.            Math.min(2 * i +2, 2 * (len - i)) > maxPalindrome.length; // potential max length should be longer than thecurrent length 
  46.            j++ 
  47.          ) { 
  48.            if (str[i - j] !== str[i + j +1]) { // if j stepsbefore the left middle is different from j steps after the right middle 
  49.              break; 
  50.            } 
  51.            if (2 * j +2> maxPalindrome.length) { // if it is longer than the current length 
  52.              maxPalindrome = lettersAndDigits.slice(i - j, i + j +2); // j steps before, middles, and j steps after 
  53.            } 
  54.          } 
  55.        } 
  56.     } 
  57.     return maxPalindrome; 
  58.    }             

以下是验证测试:

 
 
 
 
  1. console.log(findLongestPalindrome(  )); // ""  
  2.                                         console.log(findLongestPalindrome( abc )); // "a" 
  3.                                         console.log(findLongestPalindrome( Aabcd )); // "Aa" 
  4.                                         console.log(findLongestPalindrome( I am Bob. )); // "Bob" 
  5.                                         console.log(findLongestPalindrome( Odd or even )); // "Oddo" 
  6.                                         console.log(findLongestPalindrome( Never odd or even )); // "Neveroddoreven" 
  7.                                         console.log(findLongestPalindrome( Today is 02/02/2020. )); // "02022020" 
  8.                                         console.log(findLongestPalindrome( It is 2/20/2020. )); // "20202" 
  9.                                         console.log(findLongestPalindrome( A man, a plan, a canal – Panama )); // "AmanaplanacanalPanama" 

熟能生巧。享受编码!

网页名称:字符串操作大全:面试准备和日常编码所需一文打尽
文章起源:http://www.mswzjz.cn/qtweb/news49/443249.html

攀枝花网站建设、攀枝花网站运维推广公司-贝锐智能,是专注品牌与效果的网络营销公司;服务项目有等

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 贝锐智能