സിമ്പ്ലിഫൈഡ് മോളിക്യൂലാർ-ഇൻപുട് ലൈൻ‌-എൻട്രി സിസ്റ്റം

(Simplified molecular input line entry specification എന്ന താളിൽ നിന്നും തിരിച്ചുവിട്ടതു പ്രകാരം)

ലളിതമായ ആസ്കി അക്ഷരശൃംഖല ഉപയോഗിച്ചുകൊണ്ട് ഒരു രാസവസ്തുവിന്റെ തന്മാത്രാരൂപത്തെ വിവരിക്കുന്ന രീതിയാണ് സിമ്പ്ലിഫൈഡ് മോളിക്യൂലാർ-ഇൻപുട് ലൈൻ‌-എൻട്രി സിസ്റ്റം (The simplified molecular-input line-entry system (SMILES)) അഥവാ സ്മൈൽസ്. ഇങ്ങനെ ലഭ്യമാകുന്ന സൂത്രവാക്യം ഉപയോഗിച്ച് മിക്ക തന്മാത്രാഎഡിറ്ററുകൾക്കും ഈ സൂത്രവാക്യങ്ങളെ തിരികെ ദ്വിമാനചിത്രീകരണമായിട്ടോ അല്ലെങ്കിൽ ത്രിമാനരൂപങ്ങളായോ മാറ്റുവാൻ കഴിയുന്നതാണ്.

SMILES
എക്സ്റ്റൻഷൻ.smi
ഇന്റർനെറ്റ് മീഡിയ തരംchemical/x-daylight-smiles
ഫോർമാറ്റ് തരംchemical file format
Generation of SMILES: Break cycles, then write as branches off a main backbone. (Ciprofloxacin)

1980 -കളിലാണ് ഇതിന്റെ തുടക്കം. പിന്നീട് പലതരത്തിൽ മാറ്റങ്ങൾ വരുത്തുകയും കൂട്ടിച്ചേർക്കലുകൾ ഉണ്ടാവുകയും ചെയ്തിട്ടുണ്ട്. 2007 -ൽ OpenSMILES എന്നറിയപ്പെട്ട ഒരു തുറന്ന അംഗീകൃതമാതൃക ഓപൺസോഴ്സ് രസതന്ത്ര കമ്മ്യൂണിറ്റി വികസിപ്പിച്ചെടുത്തു. ഇത്തരം മറ്റുരീതികൾ Wiswesser line notation (WLN), ROSDAL, SYBYL Line Notation (SLN) ഒക്കെയാണ്.

ചരിത്രം

ഉപയോഗിക്കുന്ന അംഗീകൃതവാക്കുകൾ

ഗ്രാഫുപയോഗിച്ചുള്ള രീതികളുടെ നിർവചനങ്ങൾ

വിവരണം

ആറ്റങ്ങൾ

ആറ്റങ്ങളെ അവയുടെ ആവർത്തനപട്ടികയിലുള്ള അതേരീതിയിൽ മൂലകങ്ങളെ, രേഖപ്പെടുത്തുന്നരീതിയിൽത്തന്നെയാണ് ഇവിടെയും ഉൾക്കൊള്ളിച്ചിരിക്കുന്നത്. അവയെ ചതുരബ്രാക്കറ്റിലാവും കാണിക്കുക, ഉദാഹരണാത്തിന് സ്വർണ്ണത്തെ [Au] എന്ന്. താഴെപ്പറയുന്നിടങ്ങളിൽ ബ്രാക്കറ്റുകൾ വേണ്ടെന്നുവയ്ക്കാറുണ്ട്:

  1. are in the "organic subset" of B, C, N, O, P, S, F, Cl, Br, or I, and
  2. have no formal charge, and
  3. have the number of hydrogens attached implied by the SMILES valence model (typically their normal valence, but for N and P it is 3 or 5, and for S it is 2, 4 or 6), and
  4. are the normal isotopes, and
  5. are not chiral centers.

ബാക്കി എല്ലാ മൂലകങ്ങളെയും ചതുരബ്രാക്കറ്റുകളിൽത്തന്നെ വേണം ചിത്രീകരിക്കാൻ. ചാർജുള്ളവയെ കൃത്യമായിത്തന്നെ വേണം രേഖപ്പെടുത്താൻ. ഉദാഹരണത്തിന് വെള്ളത്തിന്റെ സ്മൈൽസ് ഒന്നുകിൽ O അല്ലെങ്കിൽ [OH2]. ഹൈഡ്രജൻ വേറൊരു ആറ്റമായി വേണമെങ്കിൽ കാണിക്കാം; വെള്ളത്തെ [H]O[H] എന്നും എഴുതാം.

When brackets are used, the symbol H is added if the atom in brackets is bonded to one or more hydrogen, followed by the number of hydrogen atoms if greater than 1, then by the sign '+' for a positive charge or by '-' for a negative charge. For example, [NH4+] for ammonium. If there is more than one charge, it is normally written as digit; however, it is also possible to repeat the sign as many times as the ion has charges: one may write either [Ti+4] or [Ti++++] for Titanium IV (Ti4+). Thus, the hydroxide anion is represented by [OH-], the hydronium cation is [OH3+] and the cobalt III cation (Co3+) is either [Co+3] or [Co+++].

ബന്ധനങ്ങൾ

ഒരു ബന്ധനത്തെ ചിത്രീകരിക്കുന്നത് ഇതിലേതെങ്കിലും ഒരു ചിഹ്നം ഉപയോഗിച്ചാണ്. '.' '-' '=' '#' '$' ':' '/' or '\'.

ചാക്രികരൂപങ്ങൾ

ഗന്ധം

Visualization of 3-cyanoanisole as COc(c1)cccc1C#N.

ശാഖകൾ

ത്രിമാനവ്യത്യസ്തഘടനാരൂപങ്ങൾ

trans-1,2-difluoroethylene
Beta-carotene, with the eleven double bonds highlighted.

ഉദാഹരണമായി ബീറ്റാകരോട്ടിന് ഒന്നിടവിട്ട ഏകബന്ധങ്ങളും ഇരട്ടബന്ധങ്ങളും ഉണ്ട്, അവയെ ഇങ്ങനെ എഴുതാം. CC1CCC/C(C)=C1/C=C/C(C)=C/C=C/C(C)=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C2=C(C)/CCCC2(C)C.

L-alanine

ഐസോടോപ്പുകൾ

ഉദാഹരണങ്ങൾ

MoleculeStructureSMILES Formula
DinitrogenN≡NN#N
Methyl isocyanate (MIC)CH3–N=C=OCN=C=O
Copper(II) sulfateCu2+ SO42−[Cu+2].[O-]S(=O)(=O)[O-]
Vanillin O=Cc1ccc(O)c(OC)c1

OCc1cc(C=O)ccc1O

Melatonin (C13H16N2O2) CC(=O)NCCC1=CNc2c1cc(OC)cc2

CC(=O)NCCc1c[nH]c2ccc(OC)cc12

Flavopereirin (C17H15N2) CCc(c1)ccc2[n+]1ccc3c2[nH]c4c3cccc4

CCc1c[n+]2ccc3c4ccccc4[nH]c3c2cc1

Nicotine (C10H14N2) CN1CCC[C@H]1c2cccnc2
Oenanthotoxin (C17H22O2) CCC[C@@H](O)CC\C=C\C=C\C#CC#C\C=C\CO

CCC[C@@H](O)CC/C=C/C=C/C#CC#C/C=C/CO

Pyrethrin II (C22H28O5) CC1=C(C(=O)C[C@@H]1OC(=O)[C@@H]2[C@H](C2(C)C)/C=C(\C)/C(=O)OC)C/C=C\C=C
Aflatoxin B1 (C17H12O6) O1C=C[C@H]([C@H]1O2)c3c2cc(OC)c4c3OC(=O)C5=C4CCC(=O)5
Glucose (glucopyranose) (C6H12O6) OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O)1
Bergenin (cuscutin) (a resin) (C14H16O9) OC[C@@H](O1)[C@@H](O)[C@H](O)[C@@H]2[C@@H]1c3c(O)c(OC)c(O)cc3C(=O)O2
A pheromone of the Californian scale insect CC(=O)OCCC(/C)=C\C[C@H](C(C)=C)CCC=C
2S,5R-Chalcogran: a pheromone of the bark beetle Pityogenes chalcographus[1] CC[C@H](O1)CC[C@@]12CCCO2
Alpha-thujone (C10H16O) CC(C)[C@@]12C[C@@H]1[C@@H](C)C(=O)C2
Thiamine (C12H17N4OS+)

(vitamin B1)

OCCc1c(C)[n+](cs1)Cc2cnc(C)nc2N

To illustrate a molecule with more than 9 rings, consider Cephalostatin-1,[2] a steroidic trisdecacyclic pyrazine with the empirical formula C54H74N2O10 isolated from the Indian Ocean hemichordate Cephalodiscus gilchristi:

Starting with the left-most methyl group in the figure:


Note that '%' appears in front of the index of ring closure labels above 9; see § Rings above.

സ്മൈൽസിന്റെ മറ്റു ഉദാഹരണങ്ങൾ

വിപുലീകരണം

അങ്ങോട്ടുമിങ്ങോട്ടും മാറ്റുന്നത്

ഇവയും കാണുക

  • SMILES arbitrary target specification SMARTS language for specification of substructural queries.
  • SYBYL Line Notation (another line notation)
  • Molecular Query Language – query language allowing also numerical properties, e.g. physicochemical values or distances
  • Chemistry Development Kit (2D layout and conversion)
  • International Chemical Identifier (InChI), the IUPAC's alternative to SMILES.
  • OpenBabel, JOELib, OELib (conversion)

അവലംബം

അധികവായനയ്ക്ക്

പുറത്തേക്കുള്ള കണ്ണികൾ

സ്മൈൽസുമായി ബന്ധപ്പെട്ടിട്ടുള്ള സൊഫ്റ്റ്‌വേറുകളും സഹായഉപകരണങ്ങളും

🔥 Top keywords: പി.എൻ. പണിക്കർവായനദിനംതുഞ്ചത്തെഴുത്തച്ഛൻബിഗ് ബോസ് (മലയാളം സീസൺ 6)കുമാരനാശാൻഈദുൽ അദ്‌ഹവള്ളത്തോൾ നാരായണമേനോൻപ്രധാന താൾപ്രത്യേകം:അന്വേഷണംഉള്ളൂർ എസ്. പരമേശ്വരയ്യർചെറുശ്ശേരിവൈക്കം മുഹമ്മദ് ബഷീർസുഗതകുമാരിമലയാളം അക്ഷരമാലആധുനിക കവിത്രയംചങ്ങമ്പുഴ കൃഷ്ണപിള്ളപാത്തുമ്മായുടെ ആട്ആടുജീവിതംബാബർകുഞ്ചൻ നമ്പ്യാർമലയാളംഒ.എൻ.വി. കുറുപ്പ്പ്രാചീനകവിത്രയംമധുസൂദനൻ നായർഅക്‌ബർകുഞ്ഞുണ്ണിമാഷ്ഇന്ത്യൻ പാർലമെന്റ്കഥകളിഹുമായൂൺമുഗൾ സാമ്രാജ്യംഎസ്.കെ. പൊറ്റെക്കാട്ട്കേരളംജഹാംഗീർഷാജഹാൻചണ്ഡാലഭിക്ഷുകികമല സുറയ്യതകഴി ശിവശങ്കരപ്പിള്ളഔറംഗസേബ്എം.ടി. വാസുദേവൻ നായർ