Facteur de transcriptionvignette|upright=2.2|Schéma simplifié du mécanisme d'un activateur. Un facteur de transcription est une protéine nécessaire à l'initiation ou à la régulation de la transcription d'un gène dans l'ensemble du vivant (procaryote ou eucaryote). Elle interagit avec l'ADN et l'ARN-polymérase. Il existe une classification complexe des facteurs de transcription. Les facteurs généraux de la transcription, impliqués dans la composition de la machinerie transcriptionnelle basale organisée autour de l'ARN polymérase II.
Transcription (biologie)En biologie moléculaire, la transcription est la première étape de l'expression génique basée sur l'ADN, au cours de laquelle un segment particulier d'ADN est « copié » en ARN par une enzyme appelée ARN polymérase. Chez les eucaryotes, la transcription se déroule dans le noyau des cellules. Certains types d'ARN appélés « ARN non codants » n'ont pas vocation à être traduits en protéines et peuvent jouer un rôle régulateur ou structurel (par exemple les ARN ribosomiques).
Séquence consensusEn biologie moléculaire et en bioinformatique, une séquence consensus est la séquence nucléotidique ou la séquence peptidique la plus fréquente à chaque position d'un alignement de séquences. Elle représente le résultat d'alignements de séquences multiples dans lesquelles les séquences apparentées sont comparées les unes aux autres afin de déterminer les motifs les plus fréquents. Cette information est importante pour les protéines dépendantes des séquences nucléotidiques, telles que les ARN polymérases.
Régulation de la transcriptionLa régulation de la transcription est la phase du contrôle de l'expression des gènes agissant au niveau de la transcription de l'ADN. Cette régulation modifiera la quantité d'ARN produit. Cette régulation est principalement effectuée par la modulation du taux de transcription par l'intervention de facteurs de transcription qui se classent en deux catégories : les éléments cis-regulateurs géniques, en coopération avec les facteurs transprotéiques. Il existe également des mécanismes de régulation de la terminaison de la transcription.
Régulation de l'expression des gènesLa régulation de l'expression des gènes désigne l'ensemble de mécanismes mis en œuvre pour passer de l'information génétique incluse dans une séquence d'ADN à un produit de gène fonctionnel (ARN ou protéine). Elle a pour effet de moduler, d'augmenter ou de diminuer la quantité des produits de l'expression des gènes (ARN, protéines). Toutes les étapes allant de la séquence d'ADN au produit final peuvent être régulées, que ce soit la transcription, la maturation des ARNm, la traduction des ARNm ou la stabilité des ARNm et protéines.
Expression génétiqueL'expression des gènes, encore appelée expression génique ou expression génétique, désigne l'ensemble des processus biochimiques par lesquels l'information héréditaire stockée dans un gène est lue pour aboutir à la fabrication de molécules qui auront un rôle actif dans le fonctionnement cellulaire, comme les protéines ou les ARN. Même si toutes les cellules d'un organisme partagent le même génome, certains gènes ne sont exprimés que dans certaines cellules, à certaines périodes de la vie de l'organisme ou sous certaines conditions.
Cis-regulatory elementCis-regulatory elements (CREs) or Cis''-regulatory modules (CRMs) are regions of non-coding DNA which regulate the transcription of neighboring genes. CREs are vital components of genetic regulatory networks, which in turn control morphogenesis, the development of anatomy, and other aspects of embryonic development, studied in evolutionary developmental biology. CREs are found in the vicinity of the genes that they regulate. CREs typically regulate gene transcription by binding to transcription factors.
Whole genome sequencingWhole genome sequencing (WGS), also known as full genome sequencing, complete genome sequencing, or entire genome sequencing, is the process of determining the entirety, or nearly the entirety, of the DNA sequence of an organism's genome at a single time. This entails sequencing all of an organism's chromosomal DNA as well as DNA contained in the mitochondria and, for plants, in the chloroplast. Whole genome sequencing has largely been used as a research tool, but was being introduced to clinics in 2014.
Sequence motifIn biology, a sequence motif is a nucleotide or amino-acid sequence pattern that is widespread and usually assumed to be related to biological function of the macromolecule. For example, an N-glycosylation site motif can be defined as Asn, followed by anything but Pro, followed by either Ser or Thr, followed by anything but Pro residue. When a sequence motif appears in the exon of a gene, it may encode the "structural motif" of a protein; that is a stereotypical element of the overall structure of the protein.
Promoteur (biologie)Un promoteur, ou séquence promotrice, est une région de l'ADN située à proximité d'un gène et indispensable à la transcription de l'ADN en ARN. Le promoteur est la zone de l'ADN sur laquelle se fixe initialement l'ARN polymérase, avant de démarrer la synthèse de l'ARN. Les séquences promotrices sont en général situées en amont du site de démarrage de la transcription. Un promoteur est aussi constitué de plusieurs séquences régulatrices de l'expression du gène, soit spécifiques à un tissu ou groupe de tissus, soit ubiquitaires, c'est-à-dire les mêmes pour tous les tissus.
Genome evolutionGenome evolution is the process by which a genome changes in structure (sequence) or size over time. The study of genome evolution involves multiple fields such as structural analysis of the genome, the study of genomic parasites, gene and ancient genome duplications, polyploidy, and comparative genomics. Genome evolution is a constantly changing and evolving field due to the steadily growing number of sequenced genomes, both prokaryotic and eukaryotic, available to the scientific community and the public at large.
GénomeLe génome (//), ou plus rarement génôme, est l'ensemble du matériel génétique d'une espèce codé dans son acide désoxyribonucléique (ADN), à l'exception de certains virus dont le génome est constitué d'acide ribonucléique (ARN). Il contient en particulier tous les gènes codant des protéines ou correspondant à des ARN structurés. Il se décompose donc en séquences codantes (transcrites en ARN messagers et traduites en protéines) et non codantes (non transcrites, ou transcrites en ARN, mais non traduites).
Binding siteIn biochemistry and molecular biology, a binding site is a region on a macromolecule such as a protein that binds to another molecule with specificity. The binding partner of the macromolecule is often referred to as a ligand. Ligands may include other proteins (resulting in a protein-protein interaction), enzyme substrates, second messengers, hormones, or allosteric modulators. The binding event is often, but not always, accompanied by a conformational change that alters the protein's function.
Séquence régulatriceLes séquences régulatrices, appelées aussi séquence-cis, sont une partie de l’ADN non codant (séquences du génome qui ne sont pas traduites en protéines) et qui influent sur le niveau de transcription des gènes. Elles sont reconnues par des facteurs de transcription, appelés facteur-trans, qui agissent de différentes façons, en augmentant ou en diminuant l’expression du gène. Les séquences régulatrices interviennent ainsi au niveau de l’initiation de la transcription dans la régulation de l'expression des gènes.
Séquence (acide nucléique)vignette| Séquence d'un ARN messager faisant apparaître ses codons. La séquence d'un acide nucléique — ADN ou ARN — est la succession des nucléotides qui le constituent. Cette succession contient l'information génétique portée par ces polynucléotides, de sorte qu'on la qualifie également de séquence génétique ou parfois de séquence nucléotidique. Elle peut être déterminée par des méthodes de séquençage de l'ADN. Les séquences nucléotidiques sont conventionnellement écrites dans le sens , qui est celui dans lequel sont lues et synthétisées ces biomolécules.
Projet de séquençage de génomeLes projets de séquençage de génome sont des projets scientifiques qui ont pour but d'obtenir les séquences complètes des génomes de différents organismes: bactéries, plantes, champignons, animaux, et humain. Ce travail nécessite la séquence de l'ADN de chacun des chromosomes de l'espèce. Pour une bactérie, il n'y a qu'un chromosome à séquencer. Pour l'espèce humaine, qui possède 22 paires de chromosomes et 2 chromosomes sexuels (X et Y), il y a 24 chromosomes à séquencer. Le projet génome humain est abouti depuis 2003.
Taille du génomevignette|Arbre phylogénétique indiquant la taille des génomes chez les organismes des trois domaines du monde vivant: les bactéries Bacteria (en bleu), les archées Archaea (en vert) et les eucaryotes Eucarya (en rouge). La taille du génome correspond à la quantité d'ADN contenue dans une copie d'un génome. La taille d'un génome est également appelée valeur C.
Alignement de séquencesEn bio-informatique, l'alignement de séquences (ou alignement séquentiel) est une manière de représenter deux ou plusieurs séquences de macromolécules biologiques (ADN, ARN ou protéines) les unes sous les autres, de manière à en faire ressortir les régions homologues ou similaires. L'objectif de l'alignement est de disposer les composants (nucléotides ou acides aminés) pour identifier les zones de concordance. Ces alignements sont réalisés par des programmes informatiques dont l'objectif est de maximiser le nombre de coïncidences entre nucléotides ou acides aminés dans les différentes séquences.
Séquençage shotgunEn génétique, le séquençage shotgun (littéralement séquençage "fusil de chasse") est une méthode utilisée pour séquencer des brins d'ADN aléatoires. On l'appelle ainsi par analogie avec le modèle de tir quasi-aléatoire en pleine expansion d'un fusil de chasse : cette métaphore illustre le caractère aléatoire de la fragmentation initiale de l'ADN génomique où l'on "arrose" tout le génome, un peu comme se dispersent les plombs de ce type d'arme à feu.
Exome sequencingExome sequencing, also known as whole exome sequencing (WES), is a genomic technique for sequencing all of the protein-coding regions of genes in a genome (known as the exome). It consists of two steps: the first step is to select only the subset of DNA that encodes proteins. These regions are known as exons—humans have about 180,000 exons, constituting about 1% of the human genome, or approximately 30 million base pairs. The second step is to sequence the exonic DNA using any high-throughput DNA sequencing technology.